0371-68273998

精准医疗与大数据引爆1.1万亿基因测序市场

基因测序的市场规模有多大?说出来吓你一跳,1.1万亿!根据前瞻产业研究院的数据显示,基因测序市场规模年均复合增速达到21.2%,到2018年预计将会突破1.1万亿的市场规模。

目前基因检测行业正处于爆发的临界点,而撬动基因测序市场持续高增长的,就是精准医学的深入,以及医疗大数据的不断应用。

放眼世界,看精准医学和医疗大数据

2016年3月,科技部公布了“精准医学研究”国家重点专项,精准医学研究上升到国家战略高度。“精准医学研究”中的“精准医学大数据管理和共享技术平台”,将作为国家唯一的精准医学大数据平台,通过汇聚和整合跨机构、跨部门的医学大数据,解决我国精准医学最关键的中国人组学等数据缺失问题,建设支撑我国精准医学研究和临床应用的国际一流的精准医学大数据平台。

中国政府高瞻远瞩,几乎与世界发达国家同步开启精准医学研究。让我们放眼看世界,了解一下其他国家和地区精准医学的举措。

1. 2012年,英国启动十万人基因组计划

2012年12月,英国政府宣布启动针对癌症和罕见病患者的英国10万人基因组计划(100,000Genomes Project)。通过该计划,英国政府预期到2017年年底实现以下四个目标:推进基因组医疗整合至英国国家医疗服务体系(NHS),并使英国在该领域引领全球;加速对癌症和罕见病的了解,从而提升有助于患者的诊断和精准治疗;促进基因组领域的私人投资和商业活动;提升公众对基因组医疗的知识和支持。

2015年年底,英国政府宣布将在未来再追加3.75亿美元的经费用于该计划。2016年6月,英国政府宣布已经完成了9892个基因组测序工作。

2. 2013年,英国首个大数据医疗科研机构揭牌

英国首个综合运用大数据技术的医药卫生科研机构于2013年5月3日在牛津大学正式揭牌,这家机构名为“李嘉诚卫生信息与发现中心”,将致力于用新兴信息技术改善医疗卫生与药物研发现状。

英国首相卡梅伦在揭牌仪式上说,医学研究新突破离不开信息获取与共享,该中心的成立有望为英国医学研究和医疗服务带来革命性变化,它将促进医疗数据分析方面的新进展,帮助科学家更好地理解人类疾病及其治疗方法。该中心包括“靶标发现研究所”和“大数据研究所”两个机构,旨在通过搜集、存储和分析大量医疗信息,确定新药物的研发方向,探索特定疾病的新疗法。

3. 2014年,韩国启动后基因组计划

2014年2月19日,韩国政府宣布正式启动后基因组计划,以推动新型基因组技术的发展和商业化。该计划包括绘制标准人类基因组图谱、发展韩国的人类基因组分析技术,以及依托基因组的疾病诊断和治疗技术等目标。

2015年11月韩国政府宣布以韩国蔚山国家科学技术研究所(UNIST)为依托,开展万人基因组计划(10,000 Genome Project)。该计划的合作者还包括蔚山市、蔚山大学、蔚山大学医院、哈佛医学院的个人基因组项目。

4. 2015年,美国总统奥巴马推出“精准医学计划”

2015年1月30日,美国总统奥巴马推出“精准医学计划”,提议在2016财年向该计划投入2.15亿美元,以推动个性化医疗的发展。

奥巴马当天在白宫举行的“精准医学计划”活动上说,“精准医学”为实现重大医学突破创造巨大机遇,为新一代拯救生命的医学发现铺平道路,指出“精准医学”所要做的是,把按基因匹配癌症疗法变得像输血匹配血型那样标准化,把找出正确的用药剂量变得像测量体温那样简单,总之,“每次都给恰当的人在恰当的时间使用恰当的疗法”。

“精准医学计划”通过整合一些现有临床研究的数据等方式,收集100万人的医疗记录、基因和生活方式等数据;寻找会诱发癌症的基因;制定相关监管规则;研究如何保护患者隐私和数据安全。

5. 2015年,香港理工大学研发大数据分析平台揭示癌症基因关系

2015年6月,香港理工大学癌症基因组的大数据分析取得重大突破,通过建立一个创新的大数据分析平台,分析基因之间的相互作用,揭示在癌症中基因网络的失控机制。

在该项研究中,研究团队假设参与相同机制的基因会呈共同表现(即基因之间的表现水平互为关连),并且探讨每对基因之间的关系,从而破解癌症背后的机制。研究团队还发现诊断及治疗慢性骨髓细胞白血病的潜在标靶基因——核磷蛋白(NPM1)及其相关基因,有关研究发现有助确立由核磷蛋白导向的治疗策略。

这项研究确立了一个创新的结构性基因共同表现分析平台,揭示癌症发病机理,并发展以核磷蛋白导向的治疗策略。共同表现分析发现了基因网络上的失控机制,加深对癌症生物学的了解,有助确定治疗的新方向。这个平台不但对科学发展有所贡献,并可随时应用于其他疾病的诊断、预后和治疗研究之上。

6. 2016年,奥巴马斥资5500万美元启动精准医疗公用数据库

奥巴马政府于2016年7月中旬宣布财年投入5500万美金建立精准医疗公用数据库,即美国政府最新投入建设的“精准医疗组”(Precision Medicine Cohort)数据库。作为精准医疗计划(PMI)的重要组成部分,该数据库将成为有史以来“最大且最具雄心壮志的研究项目。”该数据库将涵盖超过100万位志愿者的详细健康信息用于疾病的研究与个性化药物和疗法的开始。同时,这一新型数据库也将帮助美国政府更好地监管快速增长的基因检测市场。

7. 2016年,法国启动精准医疗计划

2016年6月,法国政府宣布投资6.7亿欧元启动基因组和个体化医疗项目,并将其命名为:法国基因组医疗2025 (France GenomicMedicine 2025)。该项目以提高国家医疗诊断和疾病预防能力为整体目标,预计在全国范围内建立12个基因测序平台,2个国家数据中心。项目初期将会聚焦癌症、糖尿病和罕见病。2020以后,项目将会逐步延伸至一般性疾病。

在未来10年,法国政府希望达到以下三个目标:将法国打造成世界基因组医疗领先国家;将基因组医疗整合至患者常规检测流程,意味着每年需要测23.5万个基因组;建立起一个国家基因组医疗产业,从而推动国家创新和经济增长。

除了各国政府在精准医学和基因大数据上的发力,科技巨头也在基因大数据领域纷纷布局

医疗大数据可分为四大类:诊疗数据、研发数据、患者数据以及支付和医保数据,其中,基因测序产生的大数据主要可归属于诊疗和患者数据,这类数据对于临床决策支持、疾病预防和管理、新药研发和基础研究等方面都有重大意义。科技巨头们在基因大数据领域动作频繁,积极布局。

Google(谷歌)

2012年Google就向23andMe投资150万美元。23andMe由Google联合创始人谢尔盖-布林(Sergey Brin)的妻子领导。

2013 年谷歌推出的一项名为 “Google Genomics”的云端服务,旨在帮助大学实验室和医院将患者或科研对象的生物基因储存到云端上,服务的目标是“探讨遗传变异交互”,意味着科研专家能够访问数百万的生物基因,并能轻松简单的进行对比分析。

谷歌还先后投资了Foundation medicine 和 DNAnexus 两家公司,前者是一家提供癌症全基因组测序及分析的公司;谷歌与后者DNAnexus 则一起打造一个巨大的开放式 DNA 数据库,并将共同接管联邦政府的国家生物技术信息中心(NCBI)的数据。这些数据将合并进入DNANexus的DNA信息历史文档,并储存于谷歌的云计算服务器,这是谷歌的云计算服务器中最大的第三方数据资料,免费向医学研究者提供接入服务。

另外,谷歌自身还成立了Calico 公司,利用大数据进行人类衰老及相关疾病方面研究,公司CEO 亚瑟·莱文森(Arthur Levinson)也是苹果公司董事。2014 年 7 月,google X 实验室启动 Baseline Study 项目,大量收集人类基因组标本并利用大数据合成健康人类基因图谱,为疾病的提早发现及治疗提供前提。

IBM(国际商业机器公司)

IBM Watson目前已经在医疗健康、商业、教育、市场、供应链、金融服务等领域展开了应用。IBM Watson health板块中与基因大数据相关的几个项目包括Watsonfor oncology、Watson for genomics、Watson for drug discovery。

Watson for oncology,基于 Watson 认知计算的肿瘤解决方案。我们相对比较熟悉,因为它是 IBM 旗下 Watson health 首个在中国本土化的项目。在这个项目中,Watson 的作用是建造了一个多学科会诊(MDT)的场景,通过来自普外科、肿瘤内科、放疗科、放射科、病理科、内镜中心等科室的专家经验,提出适合患者的最佳治疗方案,继而由相关学科单独或多学科联合执行该治疗方案。Watson强大优势在于其凭借知识库中290多份医学期刊,200余种教科书以及一千两百万页的医学文献、以及美国国立综合癌症网络(NCCN)发布的临床指南、纪念斯隆-凯特琳癌症中心等世界顶级肿瘤学专业国际水准肿瘤治疗专业知识来给出诊疗建议。

Watson for genomics,基于 Watson 认知计算的基因组学解决方案,是11月初由 IBM 和奎斯特诊断公司(Quest Diagnostics)联合推出的项目,目的是帮助美国肿瘤学家发展个性化医疗。Watson for Genomics将会对匿名患者数据进行筛选,为全球范围能够推进研究、揭开抗药性癌症背后隐藏模式的科学组织提供可用信息。

Watson for drug discovery,基于 Watson 认知计算的新药研发解决方案,它是一个新的云平台,旨在帮助科学家发现新的药物靶点和替代性的药物的适应症。近日,辉瑞与 IBM 达成协议,辉瑞将利用Watson for drug discovery 的机器学习、自然语言处理及其它认知推理能力,用于免疫肿瘤学中的新药物识别、联合疗法和患者选择策略。

Microsoft(微软)

在生物医学大数据领域,微软也早已启动了Microsoft Biology Initiative项目,此项目期望给生物信息学和生物学领域带来新的技术和工具,项目分为两个主要部分,即Microsoft Biology Foundation 和 Microsoft Biology Tools。MBF 是一个不依赖任何语言的生物信息学工具包,而 MBT 则是一个工具集,它能帮助生物学和生物信息学研究人员更有效的做出科学发现。相关具体信息和合作伙伴方面目前还没有更确切的消息来源。

Intel(英特尔)

上月,Intel 联手博德研究中心(Broad Institute)开展基因组信息整合计划,该计划致力于在未来五年内整合现有私人、公众以及云平台上的基因组数据以加速生命科学领域研究。除了基本的合作,双方还希望帮助生物医药公司、学术机构以及医疗保险提供者在内的多个使用者打造一个基因组数据共享平台。

英特尔致力于驱动云计算以及日益智能互联的世界,充分发挥从云到端的技术领先性,为精准医疗注入计算优势。今年 6 月,英特尔携手合作伙伴推出“精准医疗伙伴计划”,共推中国精准医疗行业健康发展,并力争在 2020 年实现 24 小时之内完成包括基因序列检测、数据分析、疾病诊断,以及制定个性化治疗方案在内的精准医疗的主要过程,并进而让精准医疗早日惠及大众。

Apple(苹果)

医疗领域是苹果公司一个“巨大的”机会,牵手 IBM 开展健康医疗大数据合作打造沃森健康云平台、与医疗机构的合作、以及正在筹备中的世界一流医疗科技团队,无一不显示着苹果在医疗领域的野心和抱负。

苹果在医疗领域方面的布局,必须提到其建立的三种类型的“Kit”数据平台。分别是 “HealthKit”、“ResearchKit”以及“CareKit”,跟本文主题最相关的是ResearchKit。运行这个平台,首先需要用户提供唾液样本,创建基因数据后保存在 ResearchKit 的云计算平台中,医院和其他研究人员可以连接ResearchKit 平台获得大量研究样本,从而让一手资料的收集过程不再困难。ResearchKit平台上已经有不少科研机构开发的 APP 取得了不少成果,比如罗彻斯特大学、赛智生物网络共同推出的 mPower,可通过小测试、简单提问、让患者动动手脚的做法来判断帕金森症的病情状况,至今已有超过 10000 人参与,这是有史以来最大的一次帕金森症临床研究。

Amazon(亚马逊)

亚马逊云服务(Amazon Web Service, AWS),早在 2006 就推向市场,以 Web 服务的形式 向企业提供 IT 基础设施服务,现在通常称为云计算。作为 AWS 公共数据集项目的一部分,合格的研究者现在可以在 AWS 上免费访问两个世界上最大的癌症基因组数据集,即癌症基因组地图集(TCGA)和国际肿瘤基因组协作组 (ICGC)。这将使研究人员能够聚焦于他们的科学研究而不是基础设施,允许他们在更短的时间内取得更多的成果,最终加快癌症研究领域的研究和探索步伐。

TCGA 语料库囊括了从数以千计的癌症患者处收集来的原始和加工过的基因组、转录基因组、和表观基因组数据,现在在 AWS S3 上对 Cancer Genomics Cloud(CGC)的用户免费开放。现在在 AWS 上也可使癌症研究者访问 2400 多组被持续分析的基因组,这些基因组对应于1100 多位独特的 ICGC 捐赠者。这些数据也将在 AWS S3 上对那些符合 ICGC 数据共享策略并受到信任的研究者免费开放。

AWS 还托管了国际千人基因组计划(1000 Genomes Project)庞大数据库,并免费开放。目前该项目拥有超过 1700 个样本,高达 200TB 数据量的 DNA 序列,这些数据都可以通过 AWS 免费获取,用于进行疾病研究。千人基因组计划的取样包括来自 26 个种群超过 2600 人的基因组,今年国家卫生研究院将继续增加其余的基因组样本到公共数据库中。

Philips(飞利浦)

IntelliSpace Genomics,即 IntelliSpace 基因组学解决方案,飞利浦医疗众多 IT 解决方案的一种,其它还包括高级分子影像、心电图诊断、放射肿瘤学、心血管 IT 解决方案等。飞利浦的 IntelliSpace 基因组学解决方案是一个可配置、可扩展,同时又是安全的医学信息解决方案,可为医院的医生和专家在治疗时提供实时可操作的诊断信息。这个平台使医生在集成的工作流程中能够利用最好的临床专业知识和系统运算能力去回答临床上的关键问题,它无缝衔接了来自多个数据源的数据,包括原始测序数据、最新的电子基因组数据库、临床资料和知识数据库、纵向患者记录、医学图像以及病理数据在内,这和 IBM 的Watson解决方案有些类似。

Facebook(脸书)

Facebook一直在健康科技领域做一些尝试,并特意强调不是指扎克伯格的野心(扎克伯格夫妇捐赠的450亿美元里,选择疾病治疗领域)。毫无疑问的是,Facebook已经证实了在一些不同领域的兴趣,包括从最先进的分子诊断方式(基因组检测)到最大众化的公共卫生(献血)等等。今年3月,Facebook推出了类似的基于研究应用“Genes For Good”,用以激发用户对基因检测的积极性。参与者使用“Genes for Good”可以参与这项研究、回答与健康有关的问题、并查看与他们健康相关的信息概要。这个正在进行的研究旨在帮助人们了解自己的基因史,以及相较于其他参与者的日常健康习惯。

国外这些科技巨头围绕着基因大数据的布局只是部分呈现了这个领域强大的号召力和发展前景,国内也有不少优秀企业都已经启动了相关的项目和合作计划,比如阿里巴巴、华为、腾讯、百度等等。基因大数据是海量的,如何共享、规范、管理和利用是关键。大数据科学横跨信息科学、社会科学、网络科学、系统科学、生物医学、心理学、经济学等诸多领域。

如何利用好基因大数据来推动医学的跨越式发展是我们急需解决的问题。

到目前为止,医疗行业还是采取通用型(one-size-fits-all)方式,但是如果我们能够根据看护人员和卫生保健专业人员收集到的数据点来评估治疗会怎么样呢?这就是精准医学,一种基于数据、算法和精准分子工具的新型医疗形式。

在精准医学方面处于领先地位的加州大学旧金山分校目前正在训练医生在诊断和治疗的过程中要和他们的病人进行不同的对话,以便于对他们的而社会、环境和经济等背景情况有所了解。精准医学将人们对医疗的关注点从识别症状到了解并治疗疾病机制。另外,精准医学还在环境和社会因素对健康的影响有所侧重。那些了解科技和医学目标的人能够为解读和联系这些数据点提供平台,在精准医学的价值链当中创造价值。

精准医疗是增加疗效,降低副作用,降低治疗费用的重要手段。詹启敏院士表示,目前的医疗技术很多都已经达到了“天花板”,临床治疗方案的效果已经达到极限。比如,同样的肿瘤类型和同样的疾病分期病人,采用相同的治疗方案情况下,只有不到50%的病人产生理想疗效,50%~70%的病人效果不明显或者没有疗效。治疗过程中有很大的被动和盲目性。

詹启敏院士表示,精准医学的发展离不开生物样本库、多组学分析平台及大数据三大平台的支撑。“谁拥有生物样本资源谁就掌握了医学科技的主动权,谁就能占据医学竞争的制高点。”而多组学分析平台是大数据的重要来源,包括测序技术、芯片技术以及培养培养组学、大数据、医学复合型人才团队等。第三,大数据平台本身包括数据的搜集、储存、分析、利用、共享和安全。这些数据包括了社区数据、队列数据、临床数据、组学数据还有结构生物学、药物分子信息等等,大数据在药物研发里面可以帮助确立新靶点、新结构,研发新药物,帮助制订新的诊疗方案以及确定在诊疗过程当中新的标准、新的规范和指南。

近年来,资本在精准医学领域的布局呈现出日趋火热的态势,国内精准医疗投资标的超过500家,领域分布于基因测序、PCR、基因芯片、液体活检、细胞免疫治疗、抗体药物以及肿瘤大数据、抗体相关、精准诊断等。

目前精准医疗正处于绝佳布局良机。一方面精准医疗行业正在蓬勃兴起,未来将涌现出更多优秀的投资标的;另一方面,精准医疗目前正处于想象到现实的爆发临界点,如基因测序成本已经降到1000美元以下,未来还仍将继续呈下降趋势,这让精准医疗的大规模应用指日可待,而大数据技术的发展,也使基因测序数据的处理能力快速显著提升。