ITの展示会@幕張メッセ

幕張メッセでやっている何が正式名称なのか良く分からないITの展示会に行って来ました。お目当てはもちろん生成AI関係ですが、正直小粒なコバンザメ型の製品・サービスばかりでウンザリしました。GAFAとの差は開くばかりで、太平洋戦争の時、米軍がブルドーザーで一晩で滑走路を作っているのに、日本軍がツルハシとモッコで一月かかっていた状況と似ています。ちなみにジャストシステムも出展していたので生成AI関係の何かを開発しているか聞いてみましたが、やっていないとのことでした。

大佛次郎の「照る日くもる日」

大佛次郎の「照る日くもる日」を読了。この小説は、サバティーニの「スカーラムッシュ」の翻案と言われていたのでそれを確かめるのが主目的の読書でした。結論としては似ているのは一番大きなプロットが一つだけで、この程度で「翻案」とか言うのは作者に失礼です。白井喬二の「珊瑚重太郎」が「ゼンダ城の虜」のパクリだとか言うのも同じレベルです。大体このレベルの小説のアイデアに著作権はありませんから。菊池寛がこの小説について「大衆小説の全ての要素が入っている」と誉めたそうですが、それは逆に誉めすぎかと。でもまあまあ面白く読めました。一番大きなプロットは最初から知っているので、ああこの男がこの男の…と簡単に想像が付きますが、それが分ったらからと言って興が殺がれることはありませんでした。主人公に二人の女性が絡み、その一人が盗賊団の一員というのは、ちょっと「雪之丞変化」を思い出させました。この小説は最初新聞小説であり、電車で通勤しながら少しずつ読んだのは丁度ぴったりした読み方だったように思います。

カセットテープ復活!

一階のこたつ部屋のオーディオにカセットデッキ追加。引っ越しによる荷物の整理で、保存していたカセットテープが40本ちょっと出てきました。念のためアイワの安いCDラジカセで試してみたら、何と全て問題なく再生出来ました。学生時代のものはもう40年以上経っています。昔の日本のメーカー(TDK、マクセル、ソニー)の品質の良さを再確認しました。そしてCDラジカセは「90分テープは使うな」と書いてあって怖いので、結局TEACの新品のデッキを買いました。ダブルカセットである必要性は無いんですが、今はこれしか売っていません。ちなみにTASCAMでも売ってますが、TASCAMはTEACの業務用ブランドであり、色が違うだけで同じ物と思います。ついでに、ヘッドクリーナーと消磁器もまだ何とか売っていたので買いました。写真のテープは大学の時、古典音楽鑑賞会というサークルの「例会」という自分が主催してみんなに聴いてもらうというので、鳥にちなむ音楽を集めた、私のお気に入りのテープです。
なお、たった40本のテープのためにデッキ買うか、という突っ込みはあるでしょうが、アイワのCDラジカセは90分テープは使わないでください、とか怖いことが書いてあるので、貴重なテープを長く楽しむため、ちゃんとしたデッキを買いました。ちなみにヤフオク等でまだテープ音源は買えます。(ほとんど演歌系ばかりですが…)
なお、昔録音したテープを聴くと、完全ではないですが、その当時使っていたオーディオ、特にサテンのMCカートリッジの音がして懐かしいです。音質はさすがに強音では歪みが目立ちますが、それは真空管アンプも同じなんで相性がいいのかも。ブラインドで聴かせれば、カセットと分らない人が多いと思います。
なお、ドルビーBはもうICが入手出来ないということで、再生の時のみのドルビーB相当のノイズリダクションが付いています。しかし録音の時には使えません。というかまず録音はしないでしょう。

スター・トレック・ザ・ネクスト・ジェネレーションの”The Child”

スター・トレック・ザ・ネクスト・ジェネレーションの”The Child”を観ました。このエピソードがシーズン2の第1話です。しかし何と言うか成功したとは言い難いエピソードで、ある深刻な毒性の強いウィルスのワクチン開発のため、そのウィルスをエンタープライズ号で運ぶという話と、エンタープライズ号に突然光みたいなものが侵入し、それがトロイの身体の中に入ってトロイが妊娠する、という話が同時並行で進行し、最後にそれが唐突に関連付けられます。トロイの妊娠は処女懐胎(?)みたいですが、トロイはライカーといい仲なので処女かどうかは怪しいですが…それでトロイの子はわずか1日で生まれ、次の日にはもう10歳くらいの少年に成長します。それで最後に何故かこの子供がエンタープライズ号にいるお陰で、エンタープライズ号が運んでいるウィルスの一部が異常に増殖し始め、このままでは保護カプセルを破壊して外に出てエンタープライズ号のクルーが全員感染して死ぬ、という危機に陥ります。それでトロイの子が自分が原因だと言い、あっさり死んでしまう、という話です。
シーズンが変わったので少しは期待しましたが、やはり脚本がダメダメですね。なお、エンタープライズ号の医師がクラッシャーから同じく女医のプラスキーに変わりました。

NHK杯戦囲碁 張栩9段 対 大竹優7段(2023年10月22日放送分)


本日のNHK杯戦の囲碁は、黒番が張栩9段、白番が大竹優7段の対戦です。対局前にちょっと驚いたのは、張栩9段はノーシードで1回戦からの出場なのに、大竹7段がシードで2回戦からということです。(多分本因坊戦リーグに入ったからでしょう。)時代が変わりつつあります。碁の内容も、大竹7段は、ぬるいと思われるくらい、張栩9段が利かしに来たのを丁寧に受け続けました。そうした打ち方が出来るのはそれでも遅れない、という形勢判断がしっかりしているのかなと思いました。この碁での最大の焦点は左下隅で、白が隅に入られないように外側で1手打った後に黒は隅に入って行きました。そして小さく活きるのは簡単でしたが、それをせず劫にしてかつ外側の白との攻め合いを目指しました。AIの推奨は隅は軽く打って捨てて外側から利かして左辺の模様を大きくするでした。結果論ですがそういう打ち方の方が良かったようです。結局黒は下辺の白、左辺から伸びる白のどちらとも攻め合いに持ち込むことが出来ず、隅の黒は打っただけ取られここに27-28目くらいの白地が出来、これが最後まで響きました。その後のAIの形勢判定はずっと白優勢でしたが、最後のヨセで実は左辺からの白を切り離す手があり、それを決行したら白の一部を取り込むことが出来逆転でした。張栩9段は感想戦で真っ先にそれを言っていましたので、見落として後から気付いたのか、あるいは何か嫌な図が見えたのかは分りませんが、時間は余していたので、じっくり読んで決行すべきでした。最終的に白の3目半勝ちで、大竹7段は初めての3回戦へ進みました。

立花和夫著の「入門タグチメソッド」

立花和夫著の「入門タグチメソッド」を何とか読了。一部飛ばした所もあります。マハラノビス距離とかに言及している割りには、タグチメソッドについて、これまで2回くらい理解しようとチャレンジして挫折していますが、3回目でようやく触りくらいは理解しました。実験計画法はQC検定だと2級、タグチメソッド(ロバストパラメータ設計)は1級の出題範囲であり、はっきり言って難しいです。前の会社で、部下の20代の若手社員に4日間のタグチメソッドの研修に行かせたことがありますが、その若手も落ちこぼれていました。
この本は数式だけではなくて、具体例が豊富で、特に安定化電源回路を使っての、S/N比と感度の説明は分かりやすかったです。つまり10Vの直流電圧を出すことをゴールとして、それに対してばらつきを与える各抵抗の公差や使用温度条件などのノイズ要因の影響を最小にするパラメーターの組み合わせを求め、それが出来てから今度は目的の10Vに持っていく、という2段階の設計がタグチメソッドの本質のようです。その過程で、直交表というある要素と別の要素の組み合わせの実験で、何通りに値を振ればいいのかを教えてくれる表を用いて実験し、その結果を使ってパラメーターの組み合わせを絞って行く、ということのようです。
この本はマハラノビス距離についての解説もあり、ユークリッド距離とどう違うのかということも良く分りました。要は要素間に相関がある場合にその相関を考慮したのがマハラノビス距離であり、それによってあるデータが基準空間の平均に近いデータなのか外れたデータかを判別するのがマハラノビス距離だということです。2つの要素に相関が無い場合は、X、Y軸にそれぞれの要素を取ると、各データの分布は円形に近くなります。しかし2つの要素に相関があれば、円形が楕円になり、原点からのユークリッド距離が同じだったデータも、マハラノビス距離では差が出てくるということになります。

「帰ってきたウルトラマン」の「富士に立つ怪獣」

「帰ってきたウルトラマン」の「富士に立つ怪獣」を観ました。今回は何と言ってもこのタイトルがいいです!どう考えても「富士に立つ影」のもじりです。しかも、富士山兆に出た怪獣パラゴンの姿が実は蜃気楼で実体は別の所にいるという、この怪獣=影なのでまさしく「富士に立つ影」な訳です。脚本を書いているのは石堂淑郎で、1932年生まれです。私が白井喬二の「富士に立つ影」を知ったのは、同じく1932年生まれの小林信彦が書いた「小説世界のロビンソン」によってですから、同年生まれの石堂が「富士に立つ影」を知っていると仮定しても間違いではないでしょう。しかし伊吹隊長が目視だと光を曲げられてしまうから、レーダーで探査して攻撃しようと言うのに、郷隊員が「電波も曲げられるのではないでしょうか」ととても真っ当な指摘をするのに、岸田隊員が例によって「MATの科学力を疑うのか!」と意味不明なことを言います。そしてこの岸田隊員が間違っているレーダーを信じてあろうことか他のMAT隊員や村人を攻撃してしまう、という前代未聞のミスを犯します。で最後はウルトラマンがブレスレットで光りを振動させ(またも何でもありのブレスレット)、蜃気楼を消して怪獣の実体を出して破ります。そして伊吹隊長のセリフが「やっぱりウルトラマンは強いなあ」で、今回はMATが点数を大幅に下げた回でした。

トークンと形態素

また生成AIネタです。
生成AIのLLM(大規模言語モデル)の中では、昔形態素と呼ばれたもの(形態素解析という意味で)がトークンと呼ばれているようです。
下記のページによればどちらも同じ意味とされています。
しかし、雑誌Interfaceの2023年11月号(「ChatGPTとプログラミング」特集)の解説によれば、英語だったらまず一文字一文字がトークンになり、それをいわゆる最長一致法的にn-gramで伸ばしていって、既に持っている語彙に一致すればそれをトークンとするという形で、ある文章のトークンへの分解が行われているようです。なので、形態素があくまで文法的な意味での文を分割する最小単位とすれば、トークンはもっと処理上の仮想的な分割単位という気がします。面白いのは生成AIのエンジンによってこの切り方が違うということで、Interfaceに載っていた例ではGPT-3.5は「処理される」を「処理/される」と切っていますが、GPT-4は「処/理/され/る」とより細かく切っています。「処理」を2つに分けて何がいいのか良くわかりませんが、「処分」とか「処置」とかの意味上の類似性のチェックとかがされているのでしょうか。
それから同じ雑誌に、デカルトが座標軸を発明して以来の、生成AIの元になっている理論の解説がありましたが、その中にはマハラノビス距離のことは一言も解説されていません。先日GPT-4にEmbeddingとマハラノビス距離の関係を聞いた回答のように、Embeddingにおけるマハラノビス距離は非常に重要な手法ですが、何故かそれを指摘している人を私はこれまで発見出来ていません。Interfaceの解説記事も本当に深い所まで分析したんじゃなくて、海外の英語等での解説記事をとりあえず集めてまとめただけという気がします。

P.S.
ずばり、ChatGTP-4に聞いてみたら、形態素とトークンは違う概念ですという回答でした。

=================================================================

 
User
生成AIでは文書を解析する最小単位としてトークンという概念が使われていますが、これは従来からある「形態素」(形態素解析)と同じですか、それとも別の概念ですか?
 
ChatGPT
「トークン」と「形態素」は似たような概念に思えるかもしれませんが、実際には異なる概念です。それぞれの違いを説明します。
 
形態素:
形態素とは、言語学の用語で、意味を持つ最小の単位です。日本語の場合、言葉を意味を持つ最小単位に分解したものを指します。例えば、言葉「食べる」は「食べ」+「る」の2つの形態素から成り立っています。
形態素解析とは、文を形態素に分解することを目的とした解析のことです。
 
トークン:
トークンは、テキストを処理する際の分割単位のことを指します。トークンは必ずしも意味を持つ最小の単位とは限らず、空白や句読点によってテキストを分割した単位を指すこともあります。
例えば、英語の文 “I love AI.” をトークン化すると、[“I”, “love”, “AI”, “.”] のようになります。
特に、多くのNLPモデルやシステムでは、特定のトークナイザーを使用してテキストをトークン化します。
形態素解析は、特に日本語などの複雑な言語を処理する際に有用な手法です。一方、トークンはテキスト処理全般において基本的な単位として使用されます。
OpenAIのモデル(例: GPT-4)では、多言語のテキストを処理するためのサブワードトークン化(一部の言語では形態素に近い単位になることもある)を用いています。このサブワードトークン化は、形態素解析とは異なるアプローチで、データから最適な分割単位を学習します。

古谷三敏の「BAR レモンハート」

古谷三敏さんの「BAR レモンハート」全37巻を揃えました。元々ほとんど持っていましたが、最後の2巻と途中で歯抜けになっていた3巻を購入して全部揃えました。なお最終巻の2話は、アシスタントの作画によります。またこれまで出てきたお酒のリストが付いています。更にはマスターとメガネさんが初登場するダメ親父の回も収録されています。(古谷さんは2021年12月に亡くなられています。)
私のお酒の知識の7割はこの漫画で得ています。またこの漫画で紹介されたことで日本での売上が増えたお酒も沢山あるように思います。たとえばジンのボンベイ・サファイアとか。

エアガン ジグ・ザウエルP228

引っ越しで出てきた、いつ買ったかも忘れたくらいのエアガン。ザウエルP228。試しにガスとBB弾を買って試射したらまったく問題なく作動しました。6mm径のプラスチックの弾ですが、近くで撃てばティッシュペーパーの箱くらいなら貫通します。なので人の目に当たったら失明する危険性があります。そのため最近はゴーグルを付けろという注意書きがされているようです。別に銃に特に思い入れはないのですが、安全装置ってどんなものか試すぐらいのつもりと後ATOKで銃器用語辞書を作ろうかと思って買ったという記憶があります。