Infty Project
数理科学情報処理システム研究プロジェクト
Mathematical Document Recognition and Analysis, User Interface,Accessibility of Scientific Documents |
||||||||||||
|
1.目的Infty Project は、科学技術情報のコンピュータ処理に関する研究・開発を行うため、複数の大学の研究者によって構成された非営利の任意団体である。共通の目的意識を持ち、共同研究を行う。また、単に研究の段階にとどめず、必ず研究成果に基づき、協力してシステム開発を行うところにその大きな特徴がある。 2.研究テーマ2009年度~2011年度にJSTの助成を受けて進めてきた化学式認識に関するサイトを公開しました。
現時点での主たる研究テーマは、
1.の電子化では、学術文献の電子化や知識データベース化における数学的コンテンツの処理技術を視野に入れ、印刷文書情報から数式を含めて編集、再利用可能な電子データへの変換、各種電子データ間の相互変換、さらには数式処理システムや論証システムなどによる処理が可能な、意味的内容を含めた電子データへの変換などを主題としている。 3.開発システムInfty Project でこれまでに開発した、あるいは開発中のシステムは以下の通りであり、そのいくつかは既に公開している。
また、数学用文書で最も高品質な印刷文書を生成できるのは LaTeX だと考えられ、InftyReader や InftyEditor は LaTeX による出力をサポートしている。その際、特に InftyEditor からの LaTeX 出力及びコンパイル制御などで必要となるすべてのマクロやツールを含めた LaTeX のシステムを非常に簡単にワン・クリックでインストールできる、 も公開している。 4.データベース数式を多く含む科学技術文書を認識する為の文字・記号認識エンジンや数式構造解析のプログラム開発には大量の学習データや評価用のサンプルデータを必要とする。InftyProject では、こうした研究のすそ野の広がりを計るため、これまでに採集してきたデータサンプルを吟味し、また著作権法に配慮した形で、数学論文から採集した、文字・記号、単語、数式の画像データベースを整備し、公開している。現在、第1回目の配布データが完成し、公開している。 数学文書の文字・記号・単語・数式データベース(第3回目) InftyCDB-3 5.論文など
6.メンバー・連絡先現時点での Infty Project の メンバーと所属のリスト プロジェクト全体に関する問い合わせ先: |
|||||||||||
▲このページのトップへ |