システム系論文の情報収集方法

(この記事は東京大学 品川研究室 Advent Calendar 2020の1日目の記事として書かれたものです)

この記事では簡単にシステム系の会議の論文に関してどうやって論文を探して読むのか.個人的な方法を書いてみようと思います.ここに書いてあることが別にすべてではないので,是非自分に合う方法を各自探してみてください.

目次

会議を知る

会議にはランク(被引用数などで決めたスコアによる順位付け)があります.一般にはランクの高い会議 = レベルが高い会議ということになります.論文を探すとき,このランクは一つの判断基準となります.ランクの高い会議である方が,良い論文がある可能性が高いためです.情報系のトップの会議については,例えば,以下のサイトにまとまっています.

ただこれは画像処理や機械学習など,いろいろなジャンルを含むので,システム系に関しては以下のものを参考にするとよいと思います.

また,セキュリティ系の会議のランクは以下にまとまっています.

ランクではないですが,クラウド系の会議の情報は以下にまとまっています.

会議のランク付け方法としては,CORE, Qualis, MSAR といったものがあります.これらは conferenceranks というサイトから調べることができます.ただしあくまで情報が最新であるとは限らない点に注意してください.また当然ですが,ランクが低いからといって良い論文がないわけではないです.

システム系で特に主要な会議としては,USENIXの会議全般 (OSDI, ATC, NSDI, FAST, SEC など) 及び IEEE の SOSP, ACMのASPLOS, VEE, EuroSys などで,他にも分野ごとにいろいろとあります.またセキュリティに関しては USENIX SEC, NDSS, IEEE S&P, ACM CCSが4大会議として知られています(暗号系を除く).

会議の日程のチェック

会議の日程は会議のサイトの他,上記に示した

にあります.気になる会議はカレンダーに登録しておくと良いでしょう.

論文を読む(サーベイする)

とりあえずシステム系の論文がどんなものか知りたい,という場合はOSDIやSOSP, ATC, EuroSysなどシステム系全般を扱っている会議で発表されている論文を眺めてみるのが良いと思います.またもし例えばネットワーク系に興味があるならNSDIなどネットワークに特化した会議をみてみると良いでしょう.Google Scholarでキーワード検索して論文を探すのも当然有効です.その際,個人的には近年のトップの会議の最近の論文を探して,そこからその論文の引用・被引用論文を辿るというやり方をしてサーベイすることが多いです.

もし大学に所属している場合は,多くの場合大学がACMIEEE包括契約しているため論文が読めるはずですが,そうでない場合も最近はだいぶオープンアクセスの流れがあり,多くの論文が無料で公開されています.とくにUSENIX系の会議は全てオープンアクセスとなっています.また,オープンアクセスでない会議でも著者のサイトに個人的なコピーがある場合があるので,読みたい論文がある場合はそちらを探してみるのも一つの手です.また最近はありがたいことに発表スライドに加えて発表動画が公開されていることも珍しくありません.積極的に活用すると良いでしょう.

論文の読み方に関してはいろいろと流儀があるので,以下に紹介するものを読むなどして自分に合う方法を探してみるのが良いと思います.

個人的にはアブストと最後のまとめを見てこの論文の動機は何で,何が貢献なのかをざっと見て,自分が探しているものと合いそうであればもう少し中身をみてみるといったパターンが多いです.上記のリンクにも書いてありますが,時間は有限でいつまでもサーベイすることはできないので,しっかり時間を決めて集中して論文ごとの貢献や関係を整理していくことが大事だと思います.

文献管理

論文を管理するためのソフトウェアが文献管理ソフトウェアです.文献管理ソフトウェアは探せばたくさんあります.特に比較はしていませんが,自分はZoteroを使っていてます.Chrome拡張機能から自動でローカルのzoteroにPDF含めて情報がインポートできるほか,クラウドのアカウントにも自動で同期されます(無料枠では300Mまで).ノートやextraの部分にメモが残せるので,読んだときに軽くメモを残しておくとができ便利です.

こうした機能はどの文献管理ソフトにもあると思います.またこれらの文献管理ソフトは簡単に論文作成には欠かせないbibtexをエクスポートする機能があるはずなので,何かしらは使った方が良いと思います.

産業系カンファレンス

システム系の場合は産業系のカンファレンスも,学術的とはちょっと毛色が異なりますが,参考になるものが多くあります.例えばLinux foundationが主宰のOpen Source Summit,KVM Forumなどや,ストレージ系ならSNIAStorage Developer Conferenceなどです.これらからは実務に即した最新の話題や課題が得られるので,論文読むのに疲れた時にチェックするといいと思います.

最新の動向を追う

本当に最新の情報を知りたい場合は,Googleアラートで特定のキーワードを指定しておく方法があります.キーワードをうまく設定しないとたくさん通知が来すぎる点には注意です.また,最近はarXivに論文を上げることも,システム系でも珍しくなくなってきています(トップ会議のほとんどはdouble blindですが,arXivなどへの投稿は許可されていることが多いです.ただし全てではありません).arXivを追う場合はOperating Systemsや,セキュリティならCryptography and Securityになるでしょう.個人的に情報が多すぎるのでarXivを追うことはあまりしていませんが,たまにキーワード検索で論文を探したりすることはあります.採択が決まっているけれどまだ会議前で公開されてない論文があるケースもあります.またLinuxであればLKMLのメーリスに登録すれば最新のカーネル情報が流れてきますが,これを真面目に追うのはかなり大変です.Gmailのフィルタ機能なので特定の機能やパッチの更新があったときに通知するようにすると良いと思います.

その他

ジャンルによってはサーベイやニュースを定期的に出したりまとめたりしている人がいます.それらを活用しない手はないでしょう.例えばBPFに関してはciliumがnewsを出しています.またブログやGitHubリポジトリに読んだ論文をまとめていたりする人もいます.他にも今はwebで検索すればいろいろとヒットすると思うので,勿論一番大事なのは論文本体ですが,たまにはそれ以外にも目を向けてみるのも悪くないと思います.ただしもしそれらで良い情報を見つけたら,一次文献に当たることは必然です.

最後に

最初にも書きましたが,論文調査方法はいろいろあるので,いろんな方法を試して自分に合うのを見つけることが大事だと思います.ここに書いたものもあくまで自分がいろいろ試した中で今利用している方法です.意外とこういった情報は共有されないことが多いので書いてみました.是非みなさんも何か良い方法があれば教えてください.