スター・トレック・ザ・ネクスト・ジェネレーションの”The Child”

スター・トレック・ザ・ネクスト・ジェネレーションの”The Child”を観ました。このエピソードがシーズン2の第1話です。しかし何と言うか成功したとは言い難いエピソードで、ある深刻な毒性の強いウィルスのワクチン開発のため、そのウィルスをエンタープライズ号で運ぶという話と、エンタープライズ号に突然光みたいなものが侵入し、それがトロイの身体の中に入ってトロイが妊娠する、という話が同時並行で進行し、最後にそれが唐突に関連付けられます。トロイの妊娠は処女懐胎(?)みたいですが、トロイはライカーといい仲なので処女かどうかは怪しいですが…それでトロイの子はわずか1日で生まれ、次の日にはもう10歳くらいの少年に成長します。それで最後に何故かこの子供がエンタープライズ号にいるお陰で、エンタープライズ号が運んでいるウィルスの一部が異常に増殖し始め、このままでは保護カプセルを破壊して外に出てエンタープライズ号のクルーが全員感染して死ぬ、という危機に陥ります。それでトロイの子が自分が原因だと言い、あっさり死んでしまう、という話です。
シーズンが変わったので少しは期待しましたが、やはり脚本がダメダメですね。なお、エンタープライズ号の医師がクラッシャーから同じく女医のプラスキーに変わりました。

NHK杯戦囲碁 張栩9段 対 大竹優7段(2023年10月22日放送分)


本日のNHK杯戦の囲碁は、黒番が張栩9段、白番が大竹優7段の対戦です。対局前にちょっと驚いたのは、張栩9段はノーシードで1回戦からの出場なのに、大竹7段がシードで2回戦からということです。(多分本因坊戦リーグに入ったからでしょう。)時代が変わりつつあります。碁の内容も、大竹7段は、ぬるいと思われるくらい、張栩9段が利かしに来たのを丁寧に受け続けました。そうした打ち方が出来るのはそれでも遅れない、という形勢判断がしっかりしているのかなと思いました。この碁での最大の焦点は左下隅で、白が隅に入られないように外側で1手打った後に黒は隅に入って行きました。そして小さく活きるのは簡単でしたが、それをせず劫にしてかつ外側の白との攻め合いを目指しました。AIの推奨は隅は軽く打って捨てて外側から利かして左辺の模様を大きくするでした。結果論ですがそういう打ち方の方が良かったようです。結局黒は下辺の白、左辺から伸びる白のどちらとも攻め合いに持ち込むことが出来ず、隅の黒は打っただけ取られここに27-28目くらいの白地が出来、これが最後まで響きました。その後のAIの形勢判定はずっと白優勢でしたが、最後のヨセで実は左辺からの白を切り離す手があり、それを決行したら白の一部を取り込むことが出来逆転でした。張栩9段は感想戦で真っ先にそれを言っていましたので、見落として後から気付いたのか、あるいは何か嫌な図が見えたのかは分りませんが、時間は余していたので、じっくり読んで決行すべきでした。最終的に白の3目半勝ちで、大竹7段は初めての3回戦へ進みました。

立花和夫著の「入門タグチメソッド」

立花和夫著の「入門タグチメソッド」を何とか読了。一部飛ばした所もあります。マハラノビス距離とかに言及している割りには、タグチメソッドについて、これまで2回くらい理解しようとチャレンジして挫折していますが、3回目でようやく触りくらいは理解しました。実験計画法はQC検定だと2級、タグチメソッド(ロバストパラメータ設計)は1級の出題範囲であり、はっきり言って難しいです。前の会社で、部下の20代の若手社員に4日間のタグチメソッドの研修に行かせたことがありますが、その若手も落ちこぼれていました。
この本は数式だけではなくて、具体例が豊富で、特に安定化電源回路を使っての、S/N比と感度の説明は分かりやすかったです。つまり10Vの直流電圧を出すことをゴールとして、それに対してばらつきを与える各抵抗の公差や使用温度条件などのノイズ要因の影響を最小にするパラメーターの組み合わせを求め、それが出来てから今度は目的の10Vに持っていく、という2段階の設計がタグチメソッドの本質のようです。その過程で、直交表というある要素と別の要素の組み合わせの実験で、何通りに値を振ればいいのかを教えてくれる表を用いて実験し、その結果を使ってパラメーターの組み合わせを絞って行く、ということのようです。
この本はマハラノビス距離についての解説もあり、ユークリッド距離とどう違うのかということも良く分りました。要は要素間に相関がある場合にその相関を考慮したのがマハラノビス距離であり、それによってあるデータが基準空間の平均に近いデータなのか外れたデータかを判別するのがマハラノビス距離だということです。2つの要素に相関が無い場合は、X、Y軸にそれぞれの要素を取ると、各データの分布は円形に近くなります。しかし2つの要素に相関があれば、円形が楕円になり、原点からのユークリッド距離が同じだったデータも、マハラノビス距離では差が出てくるということになります。

「帰ってきたウルトラマン」の「富士に立つ怪獣」

「帰ってきたウルトラマン」の「富士に立つ怪獣」を観ました。今回は何と言ってもこのタイトルがいいです!どう考えても「富士に立つ影」のもじりです。しかも、富士山兆に出た怪獣パラゴンの姿が実は蜃気楼で実体は別の所にいるという、この怪獣=影なのでまさしく「富士に立つ影」な訳です。脚本を書いているのは石堂淑郎で、1932年生まれです。私が白井喬二の「富士に立つ影」を知ったのは、同じく1932年生まれの小林信彦が書いた「小説世界のロビンソン」によってですから、同年生まれの石堂が「富士に立つ影」を知っていると仮定しても間違いではないでしょう。しかし伊吹隊長が目視だと光を曲げられてしまうから、レーダーで探査して攻撃しようと言うのに、郷隊員が「電波も曲げられるのではないでしょうか」ととても真っ当な指摘をするのに、岸田隊員が例によって「MATの科学力を疑うのか!」と意味不明なことを言います。そしてこの岸田隊員が間違っているレーダーを信じてあろうことか他のMAT隊員や村人を攻撃してしまう、という前代未聞のミスを犯します。で最後はウルトラマンがブレスレットで光りを振動させ(またも何でもありのブレスレット)、蜃気楼を消して怪獣の実体を出して破ります。そして伊吹隊長のセリフが「やっぱりウルトラマンは強いなあ」で、今回はMATが点数を大幅に下げた回でした。

トークンと形態素

また生成AIネタです。
生成AIのLLM(大規模言語モデル)の中では、昔形態素と呼ばれたもの(形態素解析という意味で)がトークンと呼ばれているようです。
下記のページによればどちらも同じ意味とされています。
しかし、雑誌Interfaceの2023年11月号(「ChatGPTとプログラミング」特集)の解説によれば、英語だったらまず一文字一文字がトークンになり、それをいわゆる最長一致法的にn-gramで伸ばしていって、既に持っている語彙に一致すればそれをトークンとするという形で、ある文章のトークンへの分解が行われているようです。なので、形態素があくまで文法的な意味での文を分割する最小単位とすれば、トークンはもっと処理上の仮想的な分割単位という気がします。面白いのは生成AIのエンジンによってこの切り方が違うということで、Interfaceに載っていた例ではGPT-3.5は「処理される」を「処理/される」と切っていますが、GPT-4は「処/理/され/る」とより細かく切っています。「処理」を2つに分けて何がいいのか良くわかりませんが、「処分」とか「処置」とかの意味上の類似性のチェックとかがされているのでしょうか。
それから同じ雑誌に、デカルトが座標軸を発明して以来の、生成AIの元になっている理論の解説がありましたが、その中にはマハラノビス距離のことは一言も解説されていません。先日GPT-4にEmbeddingとマハラノビス距離の関係を聞いた回答のように、Embeddingにおけるマハラノビス距離は非常に重要な手法ですが、何故かそれを指摘している人を私はこれまで発見出来ていません。Interfaceの解説記事も本当に深い所まで分析したんじゃなくて、海外の英語等での解説記事をとりあえず集めてまとめただけという気がします。

P.S.
ずばり、ChatGTP-4に聞いてみたら、形態素とトークンは違う概念ですという回答でした。

=================================================================

 
User
生成AIでは文書を解析する最小単位としてトークンという概念が使われていますが、これは従来からある「形態素」(形態素解析)と同じですか、それとも別の概念ですか?
 
ChatGPT
「トークン」と「形態素」は似たような概念に思えるかもしれませんが、実際には異なる概念です。それぞれの違いを説明します。
 
形態素:
形態素とは、言語学の用語で、意味を持つ最小の単位です。日本語の場合、言葉を意味を持つ最小単位に分解したものを指します。例えば、言葉「食べる」は「食べ」+「る」の2つの形態素から成り立っています。
形態素解析とは、文を形態素に分解することを目的とした解析のことです。
 
トークン:
トークンは、テキストを処理する際の分割単位のことを指します。トークンは必ずしも意味を持つ最小の単位とは限らず、空白や句読点によってテキストを分割した単位を指すこともあります。
例えば、英語の文 “I love AI.” をトークン化すると、[“I”, “love”, “AI”, “.”] のようになります。
特に、多くのNLPモデルやシステムでは、特定のトークナイザーを使用してテキストをトークン化します。
形態素解析は、特に日本語などの複雑な言語を処理する際に有用な手法です。一方、トークンはテキスト処理全般において基本的な単位として使用されます。
OpenAIのモデル(例: GPT-4)では、多言語のテキストを処理するためのサブワードトークン化(一部の言語では形態素に近い単位になることもある)を用いています。このサブワードトークン化は、形態素解析とは異なるアプローチで、データから最適な分割単位を学習します。

古谷三敏の「BAR レモンハート」

古谷三敏さんの「BAR レモンハート」全37巻を揃えました。元々ほとんど持っていましたが、最後の2巻と途中で歯抜けになっていた3巻を購入して全部揃えました。なお最終巻の2話は、アシスタントの作画によります。またこれまで出てきたお酒のリストが付いています。更にはマスターとメガネさんが初登場するダメ親父の回も収録されています。(古谷さんは2021年12月に亡くなられています。)
私のお酒の知識の7割はこの漫画で得ています。またこの漫画で紹介されたことで日本での売上が増えたお酒も沢山あるように思います。たとえばジンのボンベイ・サファイアとか。

エアガン ジグ・ザウエルP228

引っ越しで出てきた、いつ買ったかも忘れたくらいのエアガン。ザウエルP228。試しにガスとBB弾を買って試射したらまったく問題なく作動しました。6mm径のプラスチックの弾ですが、近くで撃てばティッシュペーパーの箱くらいなら貫通します。なので人の目に当たったら失明する危険性があります。そのため最近はゴーグルを付けろという注意書きがされているようです。別に銃に特に思い入れはないのですが、安全装置ってどんなものか試すぐらいのつもりと後ATOKで銃器用語辞書を作ろうかと思って買ったという記憶があります。

第三オーディオルーム

片付けた1階の和室を「第三オーディオルーム」にしました。ただ、このデノンのAmazonで中古で買ったSACDプレーヤーに問題があり、四割くらいのCDが読み込めなくて再生出来ません。なのでテストして40枚くらい再生出来るものを取り急ぎ準備しました。アンプは自作PCL86全段差動プッシュプルです。完成して一年半経ちますが問題なく動作しています。なお、アンプとスピーカーはまだまだありますが、プレーヤーがこれで最後なんで一応打ち止めです。

NHK杯戦囲碁 羽根直樹9段 対 酒井佑規4段(2023年10月15日放送分)


本日のNHK杯戦の囲碁は、黒番が羽根直樹9段、白番が酒井佑規4段の対戦です。右下隅でツケヒキ定石で黒が一間飛びではなくケイマしていた所を白がツケコシの味を見て利かしに行き、その後のやりとりの中で白がハサミツケという手を放ち、黒が反発して渡らずに下辺に打込み、その辺りから結構面倒な戦いになりました。結局上辺方面が黒で白4子くらいが取り残され、逆に下辺方面は白で黒3子が取り残されました。黒が右辺の白に活きを催促して利かしに行ったドサクサに紛れて、白は上辺方面の石の逃げ出しを図りました。それは成功しましたが、黒は左上隅の白と上辺の黒の分断に成功しました。その後黒は更に下辺の3子を動き出し、ここはまた難解な攻め合いになりましたが、紙一重で白が黒を取りました。しかし白も黒2子を抜くことが出来、左辺から左上隅方面でどのくらい黒地を付けられるかが勝負になりました。結局白はここでも最強に頑張り、2手寄せ劫残りではありましたが、ほぼ活きて優勢になりました。黒は結局劫材が続かず投了となりました。酒井4段はこれで3回戦進出で次は芝野虎丸名人です。今大会のダークホース的存在になりつつあります。

1階の和室の片付け完了

1階の和室(=私の電子ピアノ練習室)の片付けが終りました。これで引っ越しの時に荷物でふさがった部屋の片付けは完了です。
後はLDKと納戸部屋にランダムに積み上げられている荷物の片付けで、これが完了するのは多分正月休みの時。