FC2ブログ

Paragraph Vector

'word2vec'はもうお馴染の技術で、さまざまなところで使われていますね。ひとつの単語を、ベクトル(たとえば100次元)に変換する技術です。コーパス上のn-gramを利用して、確率(ニューラルネット)を用いて計算します。いわゆる「分散表現」。

この考えを、単語ではなく、パラグラフに適用したものが、たとえば以下。

Quoc Le, Tomas Mikolov, Distributed Representations of Sentences and Documents, 2014.

必要に迫られて、いま読んでいるのですが、よく解りません。この技術は、パラグラフを単語と同じ次元のベクトルに変換するというものですが、パラグラフ自体にはn-gramはないので(パラグラフの中にはあるが)、そもそも単語と同じような計算ができないのではないか、と思われました。それとも、あるパラグラフと、それに隣接する単語間の関係で考えるのかな?

私の理解が乏しいのでしょうが、もう少し考えます。
スポンサーサイト



コメントの投稿

非公開コメント

プロフィール

加納裕(かのうゆたか)

Author:加納裕(かのうゆたか)


[略歴]
1983年3月東京工業大学工学部機械物理工学科卒業
1983年4月(株)図研入社
1987年1月同社退社
1987年2月(株)ソリッドレイ研究所を6名で設立、取締役
1994年3月同社退社
1994年4月(株)スリーディー入社
1996年10月同社取締役
1999年12月上海大学兼務教授
2002年10月同社代表取締役
2009年9月ものつくり大学非常勤講師~現在
2009年10月同社代表退任/退社
2010年1月ソフトキューブ(株)入社~現在(技術顧問)
2017年4月湘南工科大学非常勤講師~現在


[業界団体・学会活動]
電気学会・第四期次世代インタラクティブディスプレイ協同研究委員会(委員)/最先端表現技術利用推進協会・アカデミック部会(旧:三次元映像のフォーラム)(副部会長)/日本バーチャルリアリティ学会ハプティクス研究委員会(委員)/ACM(Professional Member)/情報処理学会(正会員)/3Dコンソーシアム(賛助会員)/URCF(特別会員)

---------------------

前職:立体映像産業推進協議会(幹事)/日本バーチャルリアリティ学会・論文委員会(委員)/3DBiz研究会(個人賛助会員)


[資格]
TOEIC805点
数学検定1級(数理技能)
中型・普自二免許
サッカー4級審判員

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード