I-Scoverシンポジウム2014開催報告

論文ビッグデータを用いた研究動向分析と知識発見最前線 ~I-Scover:使ってみよう・やってみよう・創ってみよう~

I-Scoverプロジェクト 普及推進チーム

1. はじめに

2014年9月30日に東京・機械振興会館にて,「論文ビッグデータを用いた研究動向分析と知識発見最前線~I-Scover:使ってみよう・やってみよう・創ってみよう~」をテーマしたI-Scoverシンポジウム2014が開催されました(写真1)(開催案内はこちら).I-Scover [1]のこれまでの発展を紹介する基調講演,論文等の文献情報を用いた日本や日本の大学の研究力の分析結果あるいは新たな知見を得るための最新技術やシステム,さらにはI-Scoverチャレンジ2013の作品紹介とI-Scoverチャレンジ2014の作品募集がありました(プログラムと配付資料はこちら).I-Scoverひろば[2](写真2)や信学会メーリングリストでの開催告知により信学会会員だけでなく本テーマにご興味をもつ約50名の方の参加がありました.

image001

写真1:会場模様

image002

写真2:I-Scoverひろば

2. IEICE Knowledge Discovery(I-Scover)とシンポジウム

「I-Scover」とは,電子情報通信学会の論文誌論文・技術研究報告・大会講演論文等の知的リソースを横断的に検索するシステムです.I-Scoverでは,単に論文検索を行うことができるだけでなく,論文やその著者とその所属,出版物,イベント,キーワードなどの情報をデータとして再利用しやすい形式(Linked Data)で整理してあります.これにより研究動向の分析や著者の分析などがしやすくなっており,I-Scoverデータを活用した様々な応用が期待されています.

本シンポジウムは,I-Scover を使うとどのような情報が得られるのか,I-Scoverの論文情報を用いることによってどのような新しい知識・知見を得ることが可能なのか,I-Scoverを利用してどんな新しいアプリケーションを構築することが可能なのか,という疑問にこたえるために企画されました.

3.講演模様

まずは,基調講演として,I-Scoverプロジェクトの千村保文氏が「I-Scoverプロジェクトの概要」と題して講演されました.I-Scoverそのものの紹介,昨年度作成されたI-ScoverのPRビデオ上映(写真3)を通して初めてI-Scoverを知る聴講者にもたいへんわかりやすく説明されました.

次に,政策研究大学院大学の桑原輝隆先生より「論文情報活用に関する研究最前線」と題しまして,科研費成果やその他の論文情報をもとに,現時点での日本の研究力の国際的評価,あるいは国内研究機関の研究力の特徴についての分析結果が報告されました.

科学技術振興機構の佐藤正樹氏からは,「JST情報資産のオープン化,および他の機関との連携について」と題しまして,JSTにおける現在の取り組みが紹介されました.論文情報のオープン化や,JST主催のコンテスト,J-Stage,J-Global等の概要について説明がなされました.

広島市立大学の難波英嗣先生からは「文書分類技術を用いた検索支援および技術動向分析」と題しまして,論文をカテゴライズする方法およびシステムについての紹介,論文の価値を一般のニュース等に関連付けて評価する方法の紹介がありました.

富士通研究所/I-Scoverプロジェクトの西野文人氏からは,「Linked DataとしてのI-Scoverデータを用いた論文分析」と題して,I-Scoverプロジェクトの立場でI-Scoverの仕組みとして使われるLinked Dataについて解説がなされました.次に富士通研究所のLinked Dataに関わっている研究者の観点で,名寄せや外部データとの連携あるいはデータ整備についての提言がなされました.

I-Scoverプロジェクトの伊加田恵志氏からは「I-Scoverチャレンジ2013報告」と題した報告がなされました(写真4).

I-Scoverチャレンジ2013の入賞作品の紹介として,NTTの新井淳也氏・NTTデータ数理システムの鍋谷昴一氏からは「I-Scoverチャレンジ2013~グラフマイニングを活用した技術年表の構築~」,福岡工業大学の若原俊彦先生・槇俊孝氏からは「I-Scoverを用いた学会論文検索・分析システムの試作」に関する講演がなされました.

最後に,伊加田氏からI-Scoverチャレンジ2014の紹介がなさました.また,フリーディスカッションとして,現在のI-Scoverの課題や今後の開発計画,他組織のシステムとの連携との課題といった論点で議論がされました.

image003

写真3:I-ScoverPRビデオ画面

image004

写真4:I-Scoverチャレンジ2014の紹介をする伊加田恵志氏

image005

写真5:I-Scoverチャレンジ2013入賞作品「グラフマイニングを活用した技術年表の構築」(NTTの新井氏、NTTデータ数理システムの鍋谷氏)の講演において紹介されたI-Scoverデータの分析例

4.おわりに

本シンポジウムでの講演は,大所高所に立った論文情報分析の話からアプリ開発までと幅広く,専門家だけでなく専門外の方にとっても十分に聴きごたえのあるものとなりました.本シンポジウムで得られた知見や議論が今後のI-Scoverの積極的な利用・活用につながることを期待したいと思います.また,I-Scoverチャレンジ2014へのたくさんの作品応募をお待ちしております.

参考情報

[1] 電子情報通信学会文献検索システム IEICE Knowledge Discovery(I-Scover),http://i-scover.ieice.org

[2] I-Scoverひろば,http://iscover-p.ieice.org

z-1

z-2

z-3-kuwaharasensei

z-4-satosan

z-5-nhininisan

z-6-wakaharasensei

z-7

付録

シンポジウムプログラムと配付資料と主な質疑応答

(1)10:00-10:35
基調講演:I-Scoverプロジェクト概要 配付資料
I-Scoverプロジェクト 千村保文氏
I-Scoverそのものの紹介がなされた。昨年度作成されたビデオを上映に初めてI-Scoverを知る聴講者にもたいへんわかりやすい説明となっていた。
【質疑応答】
・コメント:はじめてI-Scoverを使った。国内論文を検索できるのはとても良い。
・Q:他学会との連携は可能か?
A:まだ連携はしていない。これから検討予定である。
・Q:名寄せはどうやっているか?
A:講演4で解説予定
・Q:第2期のユーザメリットは?
A:企業誌など検索対象が拡大できる。また、API機能を用いての分析が可能。
・Q:1日のアクセス数は?
A:1日のデータは無い。また、週により異なるが、資料にあるとおり、週に1万強のアクセスがある。

(2)10:35-11:15
講演1:論文情報活用に関する研究最前線 配付資料
政策研究大学院大学 桑原輝隆先生
科研費成果やその他の論文情報をもとに、現時点での日本の研究力の国際的評価、あるいは国内研究機関の研究力の特徴についての分析結果が報告された。
【質疑応答】
・Q:JSTのデータは?
A:現時点では公開されていない。
⇒ JST様より研究目的に限定し、公開予定とのコメントがあった。

(3)11:15-11:55
講演2:JST情報資産のオープン化、および他の機関との連携について 配付資料
科学技術振興機構 佐藤正樹氏
JSTにおける現在の取り組みが紹介された。論文情報のオープン化や、JST主催のコンテストの概要、J-Stage、J-Global等のシステム概要について説明がなされた。
【質疑応答】
・コメント:JSTとI-Scoverのデータを是非連携して欲しい。コンテストでも是非使いたい。
・Q:JSTのコンテストで高校生にはどのようにプロモーションしたのか?
A:スーパーサイエンスハイスクールなどに紹介した。
・Q:J-GLOBAL、J-STAGEとCiNiiの違いは?
A:J-GLOBAL:外国文献含む。J-STAGE:研究者、企業誌含む(査読論文のみ)。CiNii:日本の論文

(4)13:10-13:50
講演3;文書分類技術を用いた検索支援および技術動向分析 配付資料
広島市立大学 難波英嗣先生
論文をカテゴライズする方法およびシステムについての紹介、論文の価値を一般の入―す等に関連付けて評価する方法の紹介があった。
【質疑応答】
・Q:正解はどのように決まるのか?
A:科研費DBの分類を正解としている。

(5)13:50-14:30
講演4:Linked DataとしてのI-Scoverデータを用いた論文分析 <配布資料>
富士通研究所/I-Scoverプロジェクト 西野文人氏
まず、I-Scoverプロジェクトメンバーの立場でI-Scoverの仕組みとして使われるLinked Dataについて解説がなされた。次に富士通研究所のLinked Dataに関わっている研究者の観点で、名寄せや外部データとの連携について技術的な提言とともに、もっとLinked Data情報を活用した大胆なデータ整備をするべきだという提言がなされた。
【質疑応答】
・Q:人手でなく機械処理で名寄せすることで新たな発見は多いのか?
A:人では気づきにくい遠い関係を見つけることもある。

(6)14:45-15:00
講演5:I-Scoverチャレンジ2013報告 配付資料
I-Scoverプロジェクト 伊加田恵志氏
チャレンジ2013の実施方法の説明、および応募作品についての説明がなされた。
【質疑応答】
なし

(7)15:00-15:20
講演6:I-Scoverチャレンジ2013作品 その1: I- Scoverチャレンジ2013~グラフマイニングを活用した技術年表の構築~ 配付資料
NTTデータ数理システム 鍋谷昴一氏
日本電信電話株式会社 NTTソフトウェアイノベーションセンタ 新井淳也氏
グラフマイニング技術として、クラスター抽出とPageRankを用いて技術分野発展の遷移を視覚的に示す技術の紹介があった。
【質疑応答】
・Q:「確からしさ」の検証は?
A:今回は主観評価。
・Q:今、取り組んでいる課題は?
A:アプリの充実。別案件で取り組んでいる。

(8)15:20-15:40
講演7:I-Scoverチャレンジ2013作品 その2: I-Scoverを用いた学会論文検索・分析システムの試作 配付資料
福岡工業大学 若原俊彦先生,槇 俊孝氏
I-Scoverチャレンジ2013で提供されたデータを用いて作成された検索システムの紹介があった。
【質疑応答】
・Q:信学会のデータの数とCiNiiなどのデータの数が違うのは?
A: I-Scoverチャレンジで提供されたデータが昨年夏までのデータであり、この1年でこの分野の論文が多く出ているが、その数が加えられていないからI-Scoverの値が小さくなっている。
・若原先生コメント:名寄せなどに苦労したが、不完全であってもともかくデータセットがオープンデータとして利用できることは良いことだ。どんどんオープン化を進めて欲しい。
・コメント:第2期開発中である。是非、改善提案をしてほしい。
・コメント:データセット公開は良いことである。
・コメント:各研究会でデータの完全性を上げていってほしい。

(9)15:40-16:20
講演8:I-Scoverチャレンジ2014とフリーディスカッション <配布資料なし>
I-Scoverプロジェクト  伊加田恵志氏、西野文人氏、加藤直人氏
I-Scoverチャレンジ2014の実施に関する情報提供がなされた。その後、I-ScoverチャレンジあるいはI-Scoverに関するフリーディスカッションを行った。
【質疑応答】
・Q:J-STAGEとI-Scoverの違いは?
A:J-STAGEでは全ての本文は出ない。また、産業界のデータ中心。情通以外もある。I-ScoverはIEICEの論文中心。学会員は本分も見れる。学会+企業誌。
・コメント:I-Scoverの使命は、学会の文献価値を上げること。これは学会の将来に関わる問題。(青山先生)
・コメント:IEEEにコンテンツが集まると、日本に研究者が集まらなくなる。国際研究を日本がリードする必要がある。
・Q:名寄せは他のサービスとどうマッピングするのか?
A:まず、学会内の名寄せ。機関名辞書はJSTと連携している。関連機関と今後連携していきたい。
・A:信学会の内部の人名名寄せとともに世界共通IDとしてORCIDにつなぎたい。
・A(JST恒松氏): JSTではResearchmap IDという研究者IDがあるが、今後のグローバル化を考えると国内だけのIDではなくグローバルなIDが必要と考えているので、JSTもORCIDとつなげたい。
・Q: ORCID登録者は?
会場内挙手;3名
・Q:I-Scoverチャレンジ2014の応募を検討している人は?
会場内挙手:15名程度