近年、注目が高まっているデータ科学的アプローチをテーマとして、2014年11月5日〜8日に初開催された CSHL Meeting の “Biological Data Science” に参加した。従来のバイオインフォマティクスの中心であるアルゴリズム開発に関するトピックは少なく、スケール可能なゲノム解析の情報基盤に関するテーマや、医療応用に向けたゲノム解析パイプラインの大規模化や精緻化といったテーマが主だった。Global Alliance for Genomics and Health の API 共通化の取り組み、英国 NHS の10万人ゲノム、スパコンを連携させる Galaxy 基盤、NY のメモリアル・スローン・ケタリングがんセンターのポータル開発(会場から近いため多くの開発者が参加していた)といった大規模なプロジェクトでは、この運営も多くのデータの収集と管理に必要不可欠であると認識させられる。これらのプロジェクトにて「データから生命科学や医療の知見を得る」試みが本格化するのはこれからであり、次回 2016年の “Biological Data Science” が待ち遠しい。(山中)