制作符合WIPO ST.26标准要求的核苷酸或氨基酸序列表

1. 序列表历史来源

基因工程和生物工程由于其独特的学科特性,许多创新方案都会涉及到具体的核苷酸或氨基酸编码序列,具体方案的实现依赖于对应的核苷酸或氨基酸序列,如论是本领域技术人员重现相应的技术方案,还是审查评价技术方案相比于现有技术的创造性高度,都需要对于其中所涉及到核苷酸或氨基酸序列进行检索比对。

21 世纪是生命科学的世纪,越来越多生命科技创新被研发提出,这些创新成果中不乏需要依赖特定核苷酸序列或氨基酸序列的发明。如果将这些关键发明点在专利申请文件中正确的呈现是非常重要的,既影响到发明专利实质审查中审查员对于序列检索分析,也关系到本领域普通技术人员对于创新方案的理解、借鉴二次开发。

序列表定义:以纸件形式提交的专利申请说明书的一部分,它公开了核苷酸和/或氨基酸序列的详细内容和其它有用信息。

序列表中的序列是不少于10个核苷酸的非支链核苷酸序列,或者是不少于4个氨基酸的非支链氨基酸序列。所述的序列不包括支链序列;不包括具有少于4个特别定义的核苷酸或氨基酸的序列;也不包括含有列于附录1之表1-4以外的核苷酸或氨基酸的序列。

2. 老版本序列表规范标准(ST.25 标准

根据专利法实施细则第18条第4款的规定:

包含一个或多个核苷酸或者氨基酸序列的发明专利申请,说明书中应当包括符合国家知识产权局专利局规定的序列表,并按照国家知识产权局专利局的规定提交含有该序列表的计算机可读形式的副本。

中国专利局在2001年发布了《核苷酸和/或氨基酸序列表和序列表电子文件标准》(局长令第15号),制定《核苷酸和/或氨基酸序列表和序列表电子文件标准》,标准号ZC 0003—2001。规定了提交核苷酸和/或氨基酸序列表及计算机可读形式的电子文件规范,使序列表电子文件可以快捷地输入国家知识产权局专利局的计算机数据库,并与其它的序列检索数据库交换数据,以利于公众检索。

在老版本序列表规范要求中,申请人需要提交符合WIPO 序列表ST.25 标准的电子文件,文件格式是txt纯文本格式。主要格式特点是采用<xxx>三位数字标记的格式。例如申请人名称标识符为<110>,发明名称标识符为<120>,优先权申请号的识符为<150>,序列标识符为<210>,序列长度标识符为<211>,序列类型标识符为<212>。计算机通过读取<xxx>三位数字标记确定其后紧跟的文字属于序列表数据库那一栏内容。

由于ST.25 标准的电子文件非常简单,只需录入具备计算机可读取的<xxx>三位数字标记的txt格式文档即可。申请人或代理师可以直接用记事本notepad.exe、写字板writer.exe等文本编辑软件打开相应的序列表电子文件。当然,申请人和代理师更多的时候会采用欧洲专利局提供的Patent-In制作txt格式序列表电子文件(中国专利下载地址&美国专利局下载地址)。这需要工作人员具备一定的英语工作能力,在国产软件浪潮话过程中,2017年6月中国专利局也提供SIPOSequenceListing 1.0电子序列表校验及制作工具,方便使用汉语作为工作语言的申请人和代理师制作符合ST.25标准的电子文件。

ST.25 标准的电子文件优点是,非常简洁、明确,只需在txt文件中对不同位置进行添加尖括号+三位数字的标识符。当然,其简洁的优势也是其缺点所在,这些尖括号+三位数字组成的标识符人类可读性较差。而且,随着生命科学技术发展,老规定中部分内部不再适应新要求,例如,ST.25标准对于核苷酸序列中部分镜像对应/等效替换的情况不能很好的表达呈现。很多关于核苷酸或氨基酸相互替换的情况,特别是RNA和DNA核苷酸对应替换情况的限定存在部分不合理之处。

随着,五局和WIPO开会确定2022年7月1日或之后提交的申请中的核苷酸和氨基酸序列表(Sequence Listing)统一实施 WIPO ST.26标准,ST.25标准的序列表逐渐退出专利申请程序。

3. 现行序列表规范要求(WIPO ST.26标准

中国国家知识产权局公告第485号规定,2022年7月1日起涉及核苷酸或氨基酸序列表的专利申请,序列表电子文件需符合WIPO ST.26标准。同时,为核算说明书附加费用,还应提交一份PDF格式的序列表文件。

相应的,中国专利局直接指示WIPO ST.26标准具体参见世界知识产权组织网站(WIPO官网),网址:https://www.wipo.int

WIPO序列表ST.26标准PDF原文(英文版) 下载链接:STANDARD ST.26 RECOMMENDED STANDARD FOR THE PRESENTATION OF NUCLEOTIDE AND AMINO ACID SEQUENCE LISTINGS USING XML (EXTENSIBLE MARKUP LANGUAGE)

新规定调整以后,申请文件本相关序列表的电子文件采用xml(可拓展标记语言,EXTENSIBLE MARKUP LANGUAGE)格式编写。对于原标准中各个标识符改用人类易阅读的文字设置对应的标识符,同时调整增加了一些适用于新时期生命科学技术的序列表规定,使得整体序列表数据更加规范、更加标准。

为了便于申请人或代理师更好的制作符合ST.26标准的序列表,国知局还很贴心的做了如下提示:

只要在申请时符合WIPO标准ST.26,申请人可以自由使用的任何XML编辑工具来制作序列表。但是,WIPO标准ST.26很复杂,强烈建议只使用为此目的专门设计的软件。

申请人在使用“WIPO Sequence”生成ST.26XML格式序列表文件后,可以在“WIPO Sequence”中选择“打印”,生成PDF格式序列表文件。

中国专利局2022-06-23发文指示核苷酸或氨基酸序列表WIPO标准ST.26介绍及相关工具资料直接援引WIPO官网提供的软件:WIPO Sequence桌面工具。

4. 制作符合WIPO ST.26标准规定的序列表文件及PDF格式的说明书序列表文件

WIPO提供ST.26标准序列表编辑软件可以在WIPO官网序列表软件页面下载,根据世界知识产权组织官网,“WIPO Sequence桌面工具”支持三种操作系统:Windows、Mac OS和Linux。

在WIPO序列表软件页面中部可以找到如下内容,根据自己使用的计算机系统选择对应的软件版本即可。目前,WIPO Sequence套件最新版是2.3.0版,于2023年05月08日发布,申请人或代理师可以根据实际情况,直接从官网下载最新版。

Download
By downloading and installing WIPO Sequence, you are accepting the following Terms of Use (October 2021) .
Select your platform...

Windows OS (exe)

Linux (AppImage)

Mac OSX (dpm)

世界知识产权组织对于“WIPO Sequence套件”介绍是一个全球软件工具,可供专利申请人编著符合产权组织标准ST.26PDF, WIPO Standard ST.26的氨基酸和核苷酸序列表,作为国家或国际专利申请的一部分。这些工具均是在产权组织标准委员会的指导下与世界各地的专利局合作开发的。

未来生命科学相关发明中涉及到的核苷酸或氨基酸序列表,必须符合ST.26标准,可以预见未来大部分都将统一规范的使用WIPO Sequence套件进行编辑和生成。

下载适用于自己计算机的“WIPO Sequence套件”后,以管理员身份进行安装好,然后就可以进行序列表文件制作了。

如果对于软件使用有任何不清楚的地方,可以上中国专利局官网“核苷酸或氨基酸序列表WIPO标准ST.26介绍及相关工具资料”页面,找到使用教程。

序列表使用教程,中文视频观看地址:

https://www.wipo.int/meetings/zh/details.jsp?meeting_id=70209

申请人或代理师在使用“WIPO Sequence”生成符合ST.26标准的XML格式序列表文件后,可以在“WIPO Sequence”中选择“打印”,生成PDF格式序列表文件(用于提交说明书附件的序列表,公开于公开文本或授权文本的说明书后)。

5. 制作WIPO ST.26标准序列表注意事项

使用过程中,需要注意的几个容易犯错的地方:

(1)“申请确定”栏目中,如果是申请提交前制作序列表,申请人档案名是必填的,此处应填写申请人规范全称。如果是申请提交后(已经获得申请号),依然建议正确填写申请人规范全称,并在“申请人档案号”录入申请人的组织机构证代码。

(2)“申请人”栏目中,由于ST.26只允许出现一个申请人,如果有多个申请人,可以尝试逐一顺序录入,但务必将在填写第一申请人后标记,将其标记为主要申请人。

(3)“序列”栏目中,根据ST.26标准PDF第28页表1规定,在DNA序列中t代表胸腺嘧啶,在RNA序列中代表尿嘧啶。这就导致RNA序列在生成ST.26标准序列的时候,需要就u转换为t,而说明书正文部分RNA还是要保留RNA原来的写法,这会导致说明书正文的序列和最终软件导出的计算机可读文本和导出的说明书附加序列表不同,需要注意区分。

Symbol Definition
a a adenine腺嘌呤
c c cytosine胞嘧啶
g g guanine鸟嘧啶
t t thymine in DNA/uracil in RNA (t/u)

在DNA序列中t代表胸腺嘧啶,在RNA序列中代表尿嘧啶

m m a or c
r r a or g
w w a or t/u
s s c or g
y y c or t/u
k k g or t/u
v v a or c or g; not t/u
h h a or c or t/u; not g
d d a or g or t/u; not c
b b c or g or t/u; not a
n n a or c or g or t/u; “unknown” or “other”

(4)制作序列表过程中,发现软件报错的,逐一检查错误提示之处进行调整,确保文件符合ST.26规范

(5)待续…

6. 参考资料:

发布者

陈明龙

从业10+年的专利代理师、知识产权师,这里是陈明龙的私人网站,主要记录一些知识产权相关的学习笔记、工作经验总结、知产热点时事分析等。