Doorkeeper

Groonga "Tokenizer" Talks

2015-03-20(金)19:30 - 21:30 JST

GMOインターネットグループの会議室(11F)

東京都渋谷区桜丘町26番1号 セルリアンタワー

詳細

概要

Groongaの全般的な話ではなく、テーマを絞ってもっと濃厚な話をしよう!よし、「トークナイザー」の話をしよう!というイベントです。

「よくわかっていないんですけどbi-gramと形態素解析はどっちを使うのがいいんですか?」とかそんなレベルの話ではなく、もっと濃い話をしましょう。

もちろん、Groongaに特化した話もありますが、全文検索一般で使える話もあるはずです。Groongaを使っている人もGroongaにはそんなに興味はない人も、トークナイザーの濃い話をしたい!という人はぜひお越しください!

内容

このイベントではトークナイザー関連に詳しい2名からそれぞれトークナイザーに関するトークをしてもらいます。トークの途中でも、わからないこと、もっと詳しいこと聞きたいことがでてきたら、随時質問できるというスタイルで進行します。

トークしてくれる1人は、去年のいい肉の日(11/29)に開催した全文検索エンジンGroongaを囲む夕べ5で多くのスライドを残したまま終了した@naoa_yさんです。去年のイベントで話せなかったことを思う存分話してもらいます。

去年のイベントでの資料にはGroongaのトークナイザーの仕組みから独自開発のN-gramベースのトークナイザーの話までありました。ベンチマーク結果などもあって、非常に興味深い内容です。

もう1人は、長いこと自然言語処理を扱っていてたくさんのノウハウを持っているジャストシステムで開発をしている内田さんです。ジャストシステムさんが提供している拡張型NLP JMAT(ジェイマット)まわりについて話してくれるはずです。なお、JMATにはGroonga用のプラグインがあり、GroongaからJMATを使うことができます。

今回は「JMAT -ジャストシステムの日本語解析エンジンのご紹介-」と題して、ジャストシステムの最新日本語解析エンジンの性能・機能を検索での活用を中心に紹介してくれます。

ジャストシステムの開発者が学会以外で技術的な内容を話すのは今回が初めてとのことです。今まで公開されていなかったジャストシステムの自然言語処理技術を聞いてみましょう!

というように、N-gramベースの話と形態素解析ベースの両方の話が聞ける内容になっています。

タイムテーブル

入場方法

  • セルリアンタワーまでのアクセス - ConoHa が詳しいです。
    • 地上1Fからの入館を想定しています(↑リンク先の "1." の方法)
    • いつものでっかいところではないです。会議室です。
    • 飲み物はセルフサービスでお持ちください(館内に自販機はあります)
    • 無線LANあります
    • 電源はほぼありません 電源を利用したい方はテーブルタップをご自身でお持ちください(会場側では全員分は用意できません)

Ustream配信

このイベントは次のスポンサーのみなさんに協力してもらっています!ありがとうございます!

GMOメディア

GMO Media, Inc.

会場を提供してくれました!Mroongaへのバグレポートという形で開発にも協力してくれています。ありがとうございます!

コミュニティについて

Groonga

Groonga

国産の高速全文検索エンジンGroongaに関する情報を交換するための場を提供します。 Groongaだけでなく、Groonga関連プロダクトについても扱います。例えば、次のようなプロダクトです。 Mroonga: MySQLからGroongaを使うためのストレージエンジン PGroonga: PostgreSQLからGroongaを使うための拡張機能 Droonga: 分散Groong...

メンバーになる