基于多国药典的本草基因组数据库上线
中国中医科学院中药研究所陈士林研究团队依据多国药典收录的草药物种,完成基于多国药典的本草基因组数据库(GPGD)建设并上线。该数据库主要依据《中华人民共和国药典》《美国草药典》《日本药局方》《韩国药典》《印度药典》《埃及药典》《欧洲药典》及《巴西药典》等收录903个草药物种的34346条数据,是全球首个针对药典收载草药物种的大型基因组学数据库,可为草药物种鉴定、用药安全、药效成分生物合成途径解析、优良品种分子育种等方面提供信息支撑。
研究背景
传统草药在全球已有数千年应用历史,现在仍为全球85%左右人口的主要药物来源,1981~2019年新批准的药物近一半来源于天然药物或类似物,据世界卫生组织发布的全球60部官方药典中,42部(占比70%)包含草药或天然产物。在新冠肺炎疫情中,传统中药在减轻症状、减少重症率和死亡率上发挥了重要作用。为了加强传统草药的研究和应用,研究人员开发了基因DNA条形码的草药物种鉴定方法,通过全基因组测序解析关键药效成分的生物合成途径,通过分子辅助育种快速选育优良品种。对中药进行基因测定,可以保证中药的纯正,通过遗传和育种的方法,能够产出道地药材,扩大中药资源,缓解目前中药材紧张、价格昂贵、药材质量参差不齐等问题。随着中药基因研究的推进及测序技术的不断发展,中药基因组数据迅速增长,而数据格式不统一、存储于多中心等问题限制中药基因组数据的应用,建立统一的、全面的中药基因组学数据库势在必行。
研究方法及结论
基于全球八大药典的草药物种信息,收集或新产生草药多层面的基因组相关数据。目前已收集903个草药物种的34346条数据,包括867个物种的21872条DNA条形码数据,674个物种的2203个细胞器基因组,以及49个物种的55个全基因组数据等。所有数据进行统一格式化并开发、嵌入多个数据挖掘/分析工具。对于物种、基因等信息开发了模糊搜索工具;基于DNA条形码数据,开发了物种鉴定工具;基于基因组序列及基因注释信息,开发了序列BLAST搜索、序列抽取、内嵌基因组数据浏览器JBrowse等工具。该数据库将继续收集草药组学相关数据、开发更多分析工具。GPGD以网页形式进行展示,数据库网站为Linux+Apache+MySQL+PHP架构,目前可通过http://www.gpgenome.com进行公开访问。GPGD可服务于草药物种鉴定、关键次生代谢途径解析及优良品种的分子辅助育种等方面。
研究价值
该数据库是全球首个针对药典收载草药物种的大型基因组学数据库,有效地将草药基因组数据统一整合,并提供不同层面的草药基因组学相关数据及分析工具,提升草药基因组数据价值,将为草药物种鉴定、用药安全、药效成分生物合成途径解析、优良品种分子育种等方面提供极大的便利。
社会价值
该数据库由国家重点研发计划项目支持,上线以来社会访问量已经达到10万次,日均超过500次。目前已与中医药院校、综合性大学、农业大学及科研院所30余家共享了部分数据。
(责任编辑:刘茜)


