理化学研究所は、創薬などを目指す研究者らが手軽に利用できる「蛋白質立体構造予測(モデリング)データベース」を全世界に向けて公開した。理研ゲノム科学総合研究センタータンパク質構造・機能研究グループの梅山秀明客員主管研究員(北里大学薬学部教授)らの研究成果で、文部科学省が推進している「タンパク3000プロジェクト」の一環として行われたもの。
今回の研究は創薬研究などに最も重要で、かつ公的に入手可能なヒトや実験動物(ラット・マウス)の全遺伝子に対し、ホモロジーモデリング法で蛋白質のモデリングを行った。ホモロジーモデリング法とは、アミノ酸配列に相同性がある構造既知な蛋白質の立体構造を鋳型にして、構造未知蛋白質の立体構造をコンピュータで予測する手法。
こうしたモデリングデータと共に、モデリングされた蛋白質ごとのモデル評価値や他の化合物と相互作用可能な蛋白質上の場所の情報、蛋白質の説明などを充実させたデータベース「RIKEN FAMSBASE」(リケンファムスベース)を構築したもの。
このデータベースには、約600万種類の蛋白質モデリングデータが格納されている。さらに、継続的にデータ更新ができるようにするための自動更新システムを開発し、高品質のデータを提供できるようにしている。
研究グループは今年1月、インフルエンザウイルスのノイラミニダーゼに関するモデリングデータを、データベース化して公開してきたが、今回公開する包括的な立体構造予測データベースは、これを包含すると共に、質、量とも遙かに上回る情報だという。
理研では、「このようなデータベースは世界でも初めてであり、今までになく詳細で応用性の広いデータベースの公開になる」とした。この公開によって、創薬研究の活性化や、蛋白質機能の改変による新規機能性生体物質の創製などが期待されている。
なお、公開はウェブサイト(http://famshelp.gsc.riken.jp/famsbase/)で行われている。