立花和夫著の「入門タグチメソッド」

立花和夫著の「入門タグチメソッド」を何とか読了。一部飛ばした所もあります。マハラノビス距離とかに言及している割りには、タグチメソッドについて、これまで2回くらい理解しようとチャレンジして挫折していますが、3回目でようやく触りくらいは理解しました。実験計画法はQC検定だと2級、タグチメソッド(ロバストパラメータ設計)は1級の出題範囲であり、はっきり言って難しいです。前の会社で、部下の20代の若手社員に4日間のタグチメソッドの研修に行かせたことがありますが、その若手も落ちこぼれていました。
この本は数式だけではなくて、具体例が豊富で、特に安定化電源回路を使っての、S/N比と感度の説明は分かりやすかったです。つまり10Vの直流電圧を出すことをゴールとして、それに対してばらつきを与える各抵抗の公差や使用温度条件などのノイズ要因の影響を最小にするパラメーターの組み合わせを求め、それが出来てから今度は目的の10Vに持っていく、という2段階の設計がタグチメソッドの本質のようです。その過程で、直交表というある要素と別の要素の組み合わせの実験で、何通りに値を振ればいいのかを教えてくれる表を用いて実験し、その結果を使ってパラメーターの組み合わせを絞って行く、ということのようです。
この本はマハラノビス距離についての解説もあり、ユークリッド距離とどう違うのかということも良く分りました。要は要素間に相関がある場合にその相関を考慮したのがマハラノビス距離であり、それによってあるデータが基準空間の平均に近いデータなのか外れたデータかを判別するのがマハラノビス距離だということです。2つの要素に相関が無い場合は、X、Y軸にそれぞれの要素を取ると、各データの分布は円形に近くなります。しかし2つの要素に相関があれば、円形が楕円になり、原点からのユークリッド距離が同じだったデータも、マハラノビス距離では差が出てくるということになります。

「帰ってきたウルトラマン」の「富士に立つ怪獣」

「帰ってきたウルトラマン」の「富士に立つ怪獣」を観ました。今回は何と言ってもこのタイトルがいいです!どう考えても「富士に立つ影」のもじりです。しかも、富士山兆に出た怪獣パラゴンの姿が実は蜃気楼で実体は別の所にいるという、この怪獣=影なのでまさしく「富士に立つ影」な訳です。脚本を書いているのは石堂淑郎で、1932年生まれです。私が白井喬二の「富士に立つ影」を知ったのは、同じく1932年生まれの小林信彦が書いた「小説世界のロビンソン」によってですから、同年生まれの石堂が「富士に立つ影」を知っていると仮定しても間違いではないでしょう。しかし伊吹隊長が目視だと光を曲げられてしまうから、レーダーで探査して攻撃しようと言うのに、郷隊員が「電波も曲げられるのではないでしょうか」ととても真っ当な指摘をするのに、岸田隊員が例によって「MATの科学力を疑うのか!」と意味不明なことを言います。そしてこの岸田隊員が間違っているレーダーを信じてあろうことか他のMAT隊員や村人を攻撃してしまう、という前代未聞のミスを犯します。で最後はウルトラマンがブレスレットで光りを振動させ(またも何でもありのブレスレット)、蜃気楼を消して怪獣の実体を出して破ります。そして伊吹隊長のセリフが「やっぱりウルトラマンは強いなあ」で、今回はMATが点数を大幅に下げた回でした。

トークンと形態素

また生成AIネタです。
生成AIのLLM(大規模言語モデル)の中では、昔形態素と呼ばれたもの(形態素解析という意味で)がトークンと呼ばれているようです。
下記のページによればどちらも同じ意味とされています。
しかし、雑誌Interfaceの2023年11月号(「ChatGPTとプログラミング」特集)の解説によれば、英語だったらまず一文字一文字がトークンになり、それをいわゆる最長一致法的にn-gramで伸ばしていって、既に持っている語彙に一致すればそれをトークンとするという形で、ある文章のトークンへの分解が行われているようです。なので、形態素があくまで文法的な意味での文を分割する最小単位とすれば、トークンはもっと処理上の仮想的な分割単位という気がします。面白いのは生成AIのエンジンによってこの切り方が違うということで、Interfaceに載っていた例ではGPT-3.5は「処理される」を「処理/される」と切っていますが、GPT-4は「処/理/され/る」とより細かく切っています。「処理」を2つに分けて何がいいのか良くわかりませんが、「処分」とか「処置」とかの意味上の類似性のチェックとかがされているのでしょうか。
それから同じ雑誌に、デカルトが座標軸を発明して以来の、生成AIの元になっている理論の解説がありましたが、その中にはマハラノビス距離のことは一言も解説されていません。先日GPT-4にEmbeddingとマハラノビス距離の関係を聞いた回答のように、Embeddingにおけるマハラノビス距離は非常に重要な手法ですが、何故かそれを指摘している人を私はこれまで発見出来ていません。Interfaceの解説記事も本当に深い所まで分析したんじゃなくて、海外の英語等での解説記事をとりあえず集めてまとめただけという気がします。

P.S.
ずばり、ChatGTP-4に聞いてみたら、形態素とトークンは違う概念ですという回答でした。

=================================================================

 
User
生成AIでは文書を解析する最小単位としてトークンという概念が使われていますが、これは従来からある「形態素」(形態素解析)と同じですか、それとも別の概念ですか?
 
ChatGPT
「トークン」と「形態素」は似たような概念に思えるかもしれませんが、実際には異なる概念です。それぞれの違いを説明します。
 
形態素:
形態素とは、言語学の用語で、意味を持つ最小の単位です。日本語の場合、言葉を意味を持つ最小単位に分解したものを指します。例えば、言葉「食べる」は「食べ」+「る」の2つの形態素から成り立っています。
形態素解析とは、文を形態素に分解することを目的とした解析のことです。
 
トークン:
トークンは、テキストを処理する際の分割単位のことを指します。トークンは必ずしも意味を持つ最小の単位とは限らず、空白や句読点によってテキストを分割した単位を指すこともあります。
例えば、英語の文 “I love AI.” をトークン化すると、[“I”, “love”, “AI”, “.”] のようになります。
特に、多くのNLPモデルやシステムでは、特定のトークナイザーを使用してテキストをトークン化します。
形態素解析は、特に日本語などの複雑な言語を処理する際に有用な手法です。一方、トークンはテキスト処理全般において基本的な単位として使用されます。
OpenAIのモデル(例: GPT-4)では、多言語のテキストを処理するためのサブワードトークン化(一部の言語では形態素に近い単位になることもある)を用いています。このサブワードトークン化は、形態素解析とは異なるアプローチで、データから最適な分割単位を学習します。

古谷三敏の「BAR レモンハート」

古谷三敏さんの「BAR レモンハート」全37巻を揃えました。元々ほとんど持っていましたが、最後の2巻と途中で歯抜けになっていた3巻を購入して全部揃えました。なお最終巻の2話は、アシスタントの作画によります。またこれまで出てきたお酒のリストが付いています。更にはマスターとメガネさんが初登場するダメ親父の回も収録されています。(古谷さんは2021年12月に亡くなられています。)
私のお酒の知識の7割はこの漫画で得ています。またこの漫画で紹介されたことで日本での売上が増えたお酒も沢山あるように思います。たとえばジンのボンベイ・サファイアとか。

エアガン ジグ・ザウエルP228

引っ越しで出てきた、いつ買ったかも忘れたくらいのエアガン。ザウエルP228。試しにガスとBB弾を買って試射したらまったく問題なく作動しました。6mm径のプラスチックの弾ですが、近くで撃てばティッシュペーパーの箱くらいなら貫通します。なので人の目に当たったら失明する危険性があります。そのため最近はゴーグルを付けろという注意書きがされているようです。別に銃に特に思い入れはないのですが、安全装置ってどんなものか試すぐらいのつもりと後ATOKで銃器用語辞書を作ろうかと思って買ったという記憶があります。

第三オーディオルーム

片付けた1階の和室を「第三オーディオルーム」にしました。ただ、このデノンのAmazonで中古で買ったSACDプレーヤーに問題があり、四割くらいのCDが読み込めなくて再生出来ません。なのでテストして40枚くらい再生出来るものを取り急ぎ準備しました。アンプは自作PCL86全段差動プッシュプルです。完成して一年半経ちますが問題なく動作しています。なお、アンプとスピーカーはまだまだありますが、プレーヤーがこれで最後なんで一応打ち止めです。

NHK杯戦囲碁 羽根直樹9段 対 酒井佑規4段(2023年10月15日放送分)


本日のNHK杯戦の囲碁は、黒番が羽根直樹9段、白番が酒井佑規4段の対戦です。右下隅でツケヒキ定石で黒が一間飛びではなくケイマしていた所を白がツケコシの味を見て利かしに行き、その後のやりとりの中で白がハサミツケという手を放ち、黒が反発して渡らずに下辺に打込み、その辺りから結構面倒な戦いになりました。結局上辺方面が黒で白4子くらいが取り残され、逆に下辺方面は白で黒3子が取り残されました。黒が右辺の白に活きを催促して利かしに行ったドサクサに紛れて、白は上辺方面の石の逃げ出しを図りました。それは成功しましたが、黒は左上隅の白と上辺の黒の分断に成功しました。その後黒は更に下辺の3子を動き出し、ここはまた難解な攻め合いになりましたが、紙一重で白が黒を取りました。しかし白も黒2子を抜くことが出来、左辺から左上隅方面でどのくらい黒地を付けられるかが勝負になりました。結局白はここでも最強に頑張り、2手寄せ劫残りではありましたが、ほぼ活きて優勢になりました。黒は結局劫材が続かず投了となりました。酒井4段はこれで3回戦進出で次は芝野虎丸名人です。今大会のダークホース的存在になりつつあります。

1階の和室の片付け完了

1階の和室(=私の電子ピアノ練習室)の片付けが終りました。これで引っ越しの時に荷物でふさがった部屋の片付けは完了です。
後はLDKと納戸部屋にランダムに積み上げられている荷物の片付けで、これが完了するのは多分正月休みの時。

「帰ってきたウルトラマン」の「バルタン星人Jrの復讐」

「帰ってきたウルトラマン」の「バルタン星人Jrの復讐」を観ました。風邪で寝込んでいる次郎は、亡き兄から「流星に気を付けろ」という言葉を聞きます。それに従ってベランダに出ると本当に巨大な流星が落ちて来て、建設中のビルにぶつかり、そこに巨大なバルタン星人の姿が映し出されます。次郎は郷にそのことを伝えますが、郷は死んだ者が話す訳はない、バルタン星人も死んだ、とまったく相手にしません。止む無く次郎は友達で建築に興味を持っているススムに電話し、ビルを調べに行ってもらいます。ススムはそこで飼い犬がビルの壁の中に吸い込まれ、またバルタン星人の声も聞きます。それで次郎に電話して電話に出た郷にこのことを伝えようとしますが、またも郷はそういう話は明日、と電話を切ってしまいます。
ススムは次の日またビルに行き、建築中のビルが図面とは違っていることを指摘し、避難を呼びかけますが、工事人は聞く耳を持ちません。結局次郎もまたビルの中に入り、それを追いかけて郷や他のMAT隊員がビルに入った所で、バルタン星人が姿を現わし、ビルはビルガモという、キングジョーの出来損ないみたいなロボット怪獣に変わります。次郎、ススム、MAT隊員はビルガモの中に閉じ込められますが、郷が窓から脱出します。その後郷はウルトラマンになりますが、中に人がいるため攻撃出来ません。ここでまた活躍したのがススムでレンガの壁はバルタン星人が作ったものではなく地球の素材だから破壊出来る筈と言い、実際に成功します。ウルトラマンはようやくビルガモの攻撃を開始して、最後はブレスレットでバラバラにして爆破、そこでバルタン星人Jrが出現しますが、捨て台詞を残して宇宙に去ろうとするバルタン星人Jrの後ろからウルトラマンがスペシウム光線を撃って爆破します。相変わらずスペシウム光線には弱いバルタン星人でした。
しかしバルタン星人は最初に登場した時に、宇宙船ごとウルトラマンにより爆破されて全滅した筈ですが、人気があるとこうやって何度も復活します。

トワイライト・ゾーンの”Mute”

トワイライト・ゾーンの”Mute”を観ました。ドイツのある町で、6~7組ぐらいの夫婦が集まり、何やら打ち合わせています。それはこの人達の間でテレパシーの能力を身に付ける実験を、その子供達も含めて進めていくという契約についての話し合いでした。一部で、何も自分で判断出来ない子供にそういうことを強いて良いのかという疑問が出されましたが、結局全員合意します。その中の一組の夫婦が2歳の子供を連れてアメリカに渡ります。その子供が12歳になった時、大火事が起きて両親は死んでしまいます。しかしその子供は超能力でテレポーテーションして、火傷も負わずに助けられました。その女の子イルサは保安官の家に預けられます。その妻のコーラは以前娘が湖で溺死しており、イルサを可愛がります。しかしイルサは両親からテレパシーだけを使うように訓練されて来たため、話すことが出来ません。保安官は、イルサの両親がいつも手紙を受け取っていたドイツの3人へ手紙を書いて問い合わせますが、コーラがその手紙が郵便局員に渡る前に焼いてしまいます。イルサはその内学校にやられますが、そこで教師に喋るように強いられ辛い目に遭います。そのうち、イルサの両親から手紙が届かなくなったことを訝しんだドイツにいる一組の夫婦がイルサを訪ねてやって来ます。しかしコーラはイルサを渡すのを拒みます。結局イルサは次第にテレパシーの能力を失いますが、新しい母の愛を得ることが出来た、という話です。
しかし、通常の喋るのを捨ててテレパシーだけを身に付けても、相手もテレパシーで無い限りコミュニケーションは取れず、メリットは無いと思います。最初に集まった夫婦達が一体何を目指していたのかが不明です。