FC2ブログ

三次元映像のフォーラム (16)

先日(2017年3月28日)の3Dフォーラム、盛況のうちに終了いたしました。HODICとの共催で、タイトルは、「ホログラフィと3次元映像のこれまでとこれから-羽倉弘之氏のご逝去を悼んで」 、でした。東工大・大岡山にて。

私はすでに、通常の会合においては、平均年齢を上回っているわけですが、こちらでは違います。まだ若輩者?でも、これはよいことではありません。若い方々が、参入されていないということです。常に話題となります。

銀塩のホログラム制作が、「伝統工芸になりつつある」、という重い発言もあり、危機感がありますね。

私は当日、朝に受付を手伝うことになっていたのですが、前日に避けられない用が入り、やむなくドタキャン。昼過ぎにノコノコと行くと、3D界重鎮のおひとり、桑山さんに怒られました。スミマセン!
スポンサーサイト

日本VR学会の日 (4)

本日(2017年3月30日)は、日本バーチャルリアリティ学会の日です。いつもの東大・本郷キャンパス。

12:00~14:00:論文委員会
15:00~16:00:評議員会
16:00~17:00:総会
17:30~19:00:懇親会

懇親会、出られないかも...

HoloLens (3)

HoloLens、いろいろとよいところはありますが、最もよいのは、ケーブルがないところ?

ケーブルがないということは、PCが内蔵されているということです。ここで問題となりそうなのが、計算パワーです。内臓されているので、そんなに性能のよいチップは搭載できないわけです。

ここで、MRの特徴が発揮されます。MRでは、VRみたいに、画面全体に高品質のCGを描画する必要はありません。ほんの一部でいいのです。なので、内臓チップでもOK。このあたり、妙に辻褄が合っていると思われませんか?

一般相対性理論を一歩一歩数式で理解する

石井俊全先生の、「一般相対性理論を一歩一歩数式で理解する(2017)」、さっそくアマゾンで購入。本屋さんで買えばよいのですが、クレカの件が気になり、わざわざオンライン決済にて。ここは問題なく通りました。

一般相対論の書物といえば、一般読者向けのものか(なので数式は出てこない)、専門書か(難しい数式が頻出)、どちらかしかなかったのですが、これはそのどちらとも異なります。一般相対論を本当に理解したい一般のかた、本書はあなたのためにあります。でも、分厚い。

カード決済の謎

日常使っているクレジットカードで、これも日常使うオンラインサイトで、決済しようとしたところ、「このカードは利用できません」とのメッセージが出ました。

むむむ、これはどういうことでしょう。このような経験はこれまでありません。まず、このクレカが無効化されてしまったのかどうかが気になりました。自動引き落としでも使っているので、生活に支障が出ます。

そのあとの外食で、このクレカを使用してみました。問題なく決裁が通りました。カード自体は大丈夫らしい?

そこで、最初のオンラインサイトで再度決裁を試みたところ、また「利用できません」とのメッセージ。問題は解決していません。やむなく、クレカ会社に電話してみました(電話はきらいだが仕方ない)。

訊いてみると、クレカ自体には問題ないらしいのですが、何やら情報漏えいの危険性があるとのことで、セキュリティレベルが上がっていたとのことでした。ではなぜ、外食での決済は通ったのかと訊くと、オンライン決裁のほうが危険性が高いので(これは理解した)、セキュリティに引っかかった、とのことでした。

その電話で、セキュリティ問題を解消してもらったので、そのあとのオンライン決裁は通りました。なんでも、セキュリティレベルを計算するパラメタはたくさんあるそうです。このような電話で、<パラメタ>という単語を聞くとは思っていなかったので、ここに反応。流行のAIで計算しているのでしょうか。入力がたくさんあり、出力はセキュリティレベル。これがある閾値を超えると、NGとなるニューラルネット?

イラストで学ぶ機械学習 (9)

「イラストで学ぶ機械学習」、第8章は、「サポートベクトル分類」です。

SVM(Support Vector Machine)は解っているつもりでした。実際のところ、8.4までは既知の内容。

しかし、「8.5 ヒンジ損失最小化学習としての解釈」から、雲行きがあやしくなりました。極めつけは、「8.6 ランプ損失を用いたロバスト学習」。ここはかなり難しいです。なんとか、式を追いました。

混乱するところは、元々は以下の定式化のところが、

min∑|vi - fθ(xi)yi| --- (1)

掲載の計算は、以下の式を解いていることです。

min[(1/2)∑wi(viyi - θTΦ(xi))2 + (λ/2)|θ|2] --- (2)

式(1)と式(2)では、yiの位置が変わっているのですが、これでよいのかどうか、すぐに解りませんでした。確かに、yi=±1という前提においては、変わってもよいみたいですが、ちょっと説明が欲しいところです。

三次元映像のフォーラム (15)

次回の3Dフォーラム開催案内(の抜粋)です。私も出席いたします。

(ここから)--------------------------------------------------

3Dフォーラム・HODIC共催研究会「ホログラフィと3次元映像のこれまでとこれから-羽倉弘之氏のご逝去を悼んで」

日時:2017年3月28日(火)10:00~17:30(9:30 受付開始)
場所:東京工業大学 大岡山キャンパス・西9号館3F W933講義室
3Dフォーラムの参加費: 3Dフォーラム会員,表技協会員:無料(含DVD資料),一般:3,000円(含DVD資料),学生,大学関係者:無料【DVD資料は 1,500円で販売】
HODICの参加費:HODIC会員:無料 非会員:2,000円,学生で資料不要の方は無料

■プログラム 9:30 受付開始
10:00~10:10 開会 佐藤 誠 三次元映像のフォーラム代表幹事(東京工業大学名誉教授)
 黙祷 羽倉弘之 氏の逝去を悼んで(司会:桑山哲郎)
10:10~10:50 【特別プログラム 羽倉弘之氏を偲んで】「羽倉氏の思い出」中嶋正之(東京工業大学名誉教授)・羽倉様に対する言葉(出席者より)
10:50~11:30 講演 1「3D映像の生体への影響~両眼視差と輻湊眼球運動」 奥山文雄(鈴鹿医療科学大学)
11:30~12:20 講演 2「Microsoft HoloLens とVR」 林田奈美(サードウェーブデジノス)
 補足:「HMDの光学系」,「HMDにおけるヘッドトラッキング技術」 桑山哲郎(3Dフォーラム)
12:20~13:30 昼食休憩【HODICアニュアル展示,羽倉様関連の品,百年記念館展示見学】
13:30~14:10 講演 3「高臨場感メディアサービスに向けた イマーシブテレプレゼンス技術Kirari! と臨場感評価」 高田英明(日本電信電話株式会社 NTTサービスエボリューション研究所)
14:10~14:50 講演 4「ホログラフィ映画の役割、映画の明日(非圧縮4k)」 檜山茂雄(多摩美術大学)
15:00~16:00 講演 5「ホログラフィ・アートグラントと作品制作」 石井勢津子(美術家)
16:00~17:25 ホログラフィ関連の活動報告
 「Emmett N. Leith Medalの受賞」 辻内順平(東京工業大学名誉教授)
 「アメリカにおける3次元」 山口 健(日本大学)
 「ホログラフィ・ワークショップ実施の報告(仮)」 石川 洵(石川光学造形)
17:25~17;30 閉会の挨拶 橋本信幸 HODIC 会長(シチズンホールディングス)

(ここまで)--------------------------------------------------

cross-entropyの謎

Multiclass logistic regressionにおける、cross-entropyとは、PRMLによると、以下の式で書けます。

E(w1, ..., wK) = -log p(T|w1, ..., wK) = - ΣΣtnk log ynk --- (1)

PRMLでは、式(4.108)です。詳細は、PRMLをご覧ください。

これは、指数関数の<トリック>を利用したものです。つまり、

11 = 1 --- (2)
00 = 1 --- (3)

が成立するので(式(3)をよく間違える)、式(1)のように書くことができる、ということです。

一方では、式(1)自体では、0と1の間の値も入れられますね。たとえば、0.5など。こういう場合を含んでも、式(1)を使っていいんですかね...ちなみに、PRMLの当該箇所には、以下のように書かれてあります。

'This is most easily done using the 1-of-K coding scheme in which the target vector tn for a feature vector φn belonging to class Ck is a binary vector with all elements zero except for element k, which equals one.'

なので、たぶんダメ?でも、ニューラルネットのback propagationでは、これは使われます。定式化が違うんですかね...よくわからないところです。

vi

いままた、viが流行っている?

英語版のWikipediaに、viの詳しい説明があります。初版は1976年。私が初めて使ったのは、1987年です。このとき初めて、Unixを使い始めました(HPとSGIにて)。

私は、既にプログラミングからは退いているので、自身がviに触る機会は、いまはないのですが、つい最近、マックでviを使っているヒトを発見(もちろん開発者)。歴史的経緯からすれば、ビックリですね。マックは、最初にGUIを搭載したコンピュータです。それが、最近はコンソールを使いたいという理由でマックを選び、さらにそこでviを使うとは?

マックを最初に編み出したヒト(これもジョブスか?)には、ビックリでしょう。歴史は繰り返す。

言語処理学会第23回年次大会 (3)

昨日までの三日間(2017年3月14~16日)、「言語処理学会第23回年次大会」に参加してきました。完全に門外漢(知り合い皆無)。筑波大学・筑波キャンパス・春日エリアにて。ここは元々、図書館情報大学だったところですね。駅チカでウレシイ。

ここでも、機械学習が席巻しているようです。私が聴いた機械学習のセッションふたつは、満員で立ち見状態。

技術としては、単語の分散表現(word2vecなど)は常識、日本語で必須の形態素解析は、MeCabが定番、RNN(Recurrent Neural Network)も常識、LSTM(Long Short-Term Memory)も常識、という具合でした。技術の流れがよくわかりました。

回帰誤差計算の謎 (2)

前回の続きです。記事を書いたあと、某書籍を、再度確認したところ、

y = Xb --- (1)

という主張ではなく、

XTy = XTXb --- (2)

でありました。これはもちろんオッケーです。たいへん失礼いたしました...

行列は、ともすれば、スカラと同じように計算できてしまいますが、式(2)は、部分空間への射影ですね。なので、スカラをかけるのとはわけが違うのでした。油断しました。

ちなみに、某書籍というのは、以下でございます。良書です。

'Response Surface Methodology: Process and Product Optimization Using Designed Experiments (Wiley Series in Probability and Statistics) 4th Edition (2016)'

回帰誤差計算の謎

回帰分析において、観測データyとその推定値y'との差の二乗、すなわち、

(y - y')T(y - y') --- (1)

を計算してみたのですが、なにかおかしい...おヒマなかた、おつきあいください!

Xを計画行列(design matrix)、bを回帰係数の最尤推定値とすると、

y' = Xb --- (2)

が成り立ちます。また、

b = (XTX)-1XTy --- (3)

も成り立ちます。ここまでは、よく知られた結果です。

さて、式(1)を具体的に計算してみましょう。

式(1) = yTy - 2yTXb + bTXTXb --- (4)

式(4)の第3項を計算します。式(3)を使います。

式(4)の第3項 = yTX(XTX)-1XTXb = yTXb --- (5)

ここで、対称行列の逆行列は、対称行列であることを使いました。式(5)を用いると、式(4)は、

式(1) = yTy - yTXb --- (6)

式(2)を式(6)に代入すると、

式(1) = yTy - yTy' = yT(y - y') --- (7)

が得られ、ベクトルyとベクトルy - y'が直交することが示せました。これが最小二乗法の意味です。

----------------------------------

さて、これはよいのですが、某書籍(本BLOGで既に紹介したもの)では、式(4)において、

y = Xb --- (8)

であるから、として、式(4)から直ちに式(6)を導いています。

でも、ちょっと待ってください。式(8)は正しくないです。なぜならば、式(2)が正しいのですから(式(2)と式(8)は相いれない)。でも、式(6)を見ると、結局のところ、式(8)を式(4)に代入していることと同じです。某書籍もそうしている。

確かに結果は正しいのですが、なにかおかしいですよね。でも、どこがおかしいのかわからないです。内積のトリックのような気がしますが...

言語処理学会第23回年次大会 (2)

本日(2017年3月14日)から、「言語処理学会第23回年次大会」に参加します。完全に門外漢です。場所は、筑波大学・筑波キャンパス・春日エリア。

本日のターゲットは、機械学習のふたつのセッションです。それぞれ、三つの発表がございます。やはり、RNN(Recurrent Neural Network)ですかね?

Deep Learning (4)

Deep Learning(DL)、相変わらず注目されていますね。すでに当たり前になりました。

ここで問題になるのが、教師データの必要性です。DLでは、大量のデータが必要ですが、実際のところ、そんなにないのが実情です。

画像の場合、ここで使われ出しているのが、CG画像です。いまのCGは、現実と殆ど変わらない画像が生成できますから、これを教師データとして使おうという試みです。

でも、本当にCG画像は実画像の代わりになるのでしょうか?これは検証されていないはず。なぜならば、実画像が得られるのであれば、もともとCGは使わないですからね。

CVIM (7)

昨日~本日(2017年3月9-10日)と、情報処理学会・CVIM研究会に参加しています。場所は、国立情報学研究所(NII)。CVIMは、久しぶりの気がします。情処では、唯一登録している研究会。

昨日の、以下の発表におきまして、

・複数のカメラモデルのためのStructure from Motionの構築、前田 尚活, 内山 英昭, 長原 一, 谷口 倫一郎(九大)

思いのほか、活発な議論がありました。詳しくは書きませんが(知識がないので書けませんが)、発表内容自体は、予稿を読めば解るものの、こういう研究会に参加するメリットは、発表後の議論です。議論は予稿にはありません。これが思わぬ発見や、疑問解消につながります。昨日もそのような経験をいたしました。

Paragraph Vector

'word2vec'はもうお馴染の技術で、さまざまなところで使われていますね。ひとつの単語を、ベクトル(たとえば100次元)に変換する技術です。コーパス上のn-gramを利用して、確率(ニューラルネット)を用いて計算します。いわゆる「分散表現」。

この考えを、単語ではなく、パラグラフに適用したものが、たとえば以下。

Quoc Le, Tomas Mikolov, Distributed Representations of Sentences and Documents, 2014.

必要に迫られて、いま読んでいるのですが、よく解りません。この技術は、パラグラフを単語と同じ次元のベクトルに変換するというものですが、パラグラフ自体にはn-gramはないので(パラグラフの中にはあるが)、そもそも単語と同じような計算ができないのではないか、と思われました。それとも、あるパラグラフと、それに隣接する単語間の関係で考えるのかな?

私の理解が乏しいのでしょうが、もう少し考えます。

今後のマラソン予定 (25)

マラソン予定のアップデートです!

1)第1回多摩ウィンターマラソン大会(5キロ、神奈川、2017年3月20日)←知人と
2)軽井沢ハーフマラソン2017(ハーフ、長野、2017年5月21日)←連れと
3)第8回南魚沼グルメマラソン(ハーフ、新潟、2017年6月11日)←連れと

1)は初めて(第1回なのであたりまえ)、2)は3年連続4回目、3)は3年ぶり3回目です。

Guide to 3D Vision Computation: Geometric Analysis and Implementation (2)

Springerからの新刊、'Guide to 3D Vision Computation: Geometric Analysis and Implementation'、ですが、やっと手元に届きました。発注から到着に、結構時間がかかりました。

コンパクトにまとまっていて、関連の技術が一気に学べそうです。定番の、Hartley & Zissermanのものと、併用いたします。でも、こちらのほうが、10年以上新しい。定番の座を奪うことができますでしょうか。

宅配便コンビニ受け取りの謎

某通販からの荷物が、某宅配会社から届くことになり、待っていました。

まず、「明日に到着します」とのメールが来ました。いつもは自宅で受け取るのですが、不在がちの我が家、初めての「コンビニ受け取り」を選択しました。自宅から近くのコンビニです。帰宅前に立ち寄って、受け取ろうとの思惑です。

当日、思惑通り、仕事からの帰宅前、そのコンビニに立ち寄りました。すると、ここには着いていない、との返事。え!荷物がどこかに行ってしまうと困るので、届いたら携帯に電話するように頼みました。念のため、同じコンビニが近くにあるので、そこもチェック。店舗を間違った可能性があると思ったからですが、ここにもなし。

不安を抱えながら帰宅すると、なんと、自宅に届いていました。よかった!でも、ネットでのコンビニ指定とはなんだったのでしょうか。結局のところ、宅配においては、ICTの進化はありますが、最後に作業をするのはヒトなんです。今回はICT上では完璧でしたが、最後にヒトが間違ったということ。もっとも、宅配をしてくれたヒトは、いつも自宅に届けてくれるので、習慣上そのようにされたのでしょう。

コンビニでの学生と思われるバイトさん、丁寧に対応してくれたので、そのあとすぐにチャリでコンビニへ。自宅に届いていた旨、伝えました。

イラストで学ぶ機械学習 (8)

「イラストで学ぶ機械学習」、第6章は、「ロバスト学習」です。

いろいろと書かれてありますが、結局のところ、62ページの、以下の式が結論です。

θ←(ΦT + λΘ)-1ΦTWy --- (1)

式(1)で、ℓ2損失、Huber損失、Tukey損失、ℓ2制約、ℓ1制約など、あらゆる実装ができます。すごい式です。機械学習の中でも、最強の式のひとつ?

退院三周年

本日(2017年3月2日)は、退院からちょうど三年目です。退院時の記事はこちら(↓)です。

http://kanouy.blog9.fc2.com/blog-entry-1046.html

三年間、順調に、健康に過ごしています。当時からすると、夢のようです。

三年前の退院の日を思い出すと、懐かしく感じられます。入院を経験した人の話を聞くと、だいたいは、早く退院したいとなるらしいのですが、私は真逆で、退院の前日は、非常に寂しい思いをしました。このまま入院していたいな、と切に思いました。三食昼寝付き!

退院して、病院を出たときの外気が、たいへん冷たく感じられました。また、キビシイ実世界に戻るんだなと...

Trello

あるプロジェクトで、Trelloという、タスク管理ツールを使うことにしました。

これは非常に単純です。タスクの種別は、'Ice box'、'Candidates'、'To do'、'Doing'、'On going'、'Done'の6つだけ。ウェブベースで、リアルタイムにタスクの編集が、共有しながら可能です。やはり、ウェブベースでないと。

あまり入力が面倒くさいものだと、どんなに機能が充実していたとしても、使われなくなります。プロジェクト管理では、継続することが必要。Trelloは、なかなか考えられたツールです。エッセンスのみ取り出した、という印象ですね。
プロフィール

加納裕(かのうゆたか)

Author:加納裕(かのうゆたか)


[略歴]
1983年3月東京工業大学工学部機械物理工学科卒業
1983年4月(株)図研入社
1987年1月同社退社
1987年2月(株)ソリッドレイ研究所を6名で設立、取締役
1994年3月同社退社
1994年4月(株)スリーディー入社
1996年10月同社取締役
1999年12月上海大学兼務教授
2002年10月同社代表取締役
2009年9月ものつくり大学非常勤講師~現在
2009年10月同社代表退任/退社
2010年1月ソフトキューブ(株)入社~現在(技術顧問)
2017年4月湘南工科大学非常勤講師~現在


[業界団体・学会活動]
電気学会・第三期次世代インタラクティブディスプレイ協同研究委員会(幹事)/最先端表現技術利用推進協会・アカデミック部会(旧:三次元映像のフォーラム)(副部会長)/日本バーチャルリアリティ学会ハプティクス研究委員会(委員)/ACM・SIGGRAPH(Professional Member)/情報処理学会(正会員、CVIM会員)/3Dコンソーシアム(賛助会員)/3DBiz研究会(個人賛助会員)/URCF(特別会員)

----------------

前職:立体映像産業推進協議会(幹事)/日本バーチャルリアリティ学会・論文委員会(委員)


[資格]
TOEIC805点
数学検定1級(数理技能)
中型・普自二免許
サッカー4級審判員

最新記事
最新コメント
最新トラックバック
月別アーカイブ
カテゴリ
検索フォーム
RSSリンクの表示
リンク
ブロとも申請フォーム

この人とブロともになる

QRコード
QRコード