さらに本…

更に本棚を一つ追加購入し、さらにその上にオーディオラックを1段載せて、アカデミック関係の文庫本以外を収録。ついに本棚の数が大小合わせて21台になりました。いかに5LDKとはいえ、さすがにそこら中に本棚で、廊下にまで本棚がある、ということになっています。まあでもこれでいつでも自分が持っている書籍を見つけることが出来るようになりました。後10年くらいすると、生成AIがこの程度の書籍の内容は全て学習していて、質問すればどの本にどう書いてあったかたちどころに回答してくるような気がします。そうなったら書籍は処分出来ますが…

「帰ってきたウルトラマン」の「ウルトラの星光る時」

「帰ってきたウルトラマン」の「ウルトラの星光る時」を観ました。ブラックキングとナックル星人のタッグに倒された新マンが処刑のためにナックル星に運ばれます。そこに「♫胸につけーてる」と初代マンの主題歌、そして「♫はるかな星が故郷だ」のセブンの主題歌で、まずはハヤタ隊員とモロボシダンが登場し、二人の変身シーンまで見せてくれます。そしてこれまでセブンは登場していますが、初代マンは初めてで、この回で新マンが初代が帰って来たのではない、ということがある意味証明されます。そんな訳で新マンは無事復活しますが、今度はMATの隊員がナックル星人の基地を吹っ飛ばそうとして逆に催眠術にかけられ、正気の丘隊員を襲います。それでも郷が戻って来て丘隊員と協力して皆を正気に戻し、ブラックキング+ナックル星人との再度の戦いに臨みます。また苦戦する新マンでしたが、最後はウルトラギロチン?でブラックキングもナックル星人もやっつけます。
それでアキがいなくなったと思ったら、すぐに別の女性登場、で次郎君にとっては良かったのでしょうが、郷隊員はそれはないでしょう、という感じです。
ともかく前回と今回が良くも悪くも新マンでもっとも劇的な展開の回でした。

辞書・事典の整理

書籍の整理第三弾。辞書・事典類。全部で100冊ありました。国語辞書が12冊もあるけど、これは日本語変換ソフトの開発部署にいた名残です。今はほとんど引くことはありません。英語も英和と和英は普段はほとんど英辞郎とカシオの電子辞書で間に合っています。オックスフォードのラテン語大辞典2冊は、マックス・ヴェーバーの「ローマ土地制度史」の翻訳のため買いました。

外国語関係の書籍の整理

ヴェーバー関係の書籍の整理に続けて、外国語関係の書籍の整理。本だけで言えば、英語、ドイツ語、古典ラテン語、古典ギリシア語、サンスクリット語、ヘブライ語、フランス語、イタリア語、スウェーデン語、フィンランド語、スペイン語、ポーランド語、ロシア語、韓国語、広東語、中国語、ベトナム語、タイ語、インドネシア語(マレー語)、アラビア語、アイヌ語と21ヶ国語になります。もちろん本だけ買ってざっと眺めただけ、というのが大半ですが。

ヴェーバー関係の書籍の整理

新居にてようやく段ボール箱開梱もほぼ終って、これまで本はかなり適当に空いている本棚に詰めていただけなのを、本棚を更に1台追加して、まずマックス・ヴェーバー関係を集めてみました。残念ながら1台では足らず、翻訳の時の資料とかは溢れてしまいました。これだけ集めたのは、今集めておかないともう簡単には買えなくなるという予感があったからです。例えば「経済と社会」の日本語訳を出していた創文社は解散してしまいました。なのでヴェーバー本人の書いたものは大体読みましたが、研究書や入門書の類いはきちんと読んでないのが沢山あります。

「帰ってきたウルトラマン」の「ウルトラマン 夕陽に死す」

「帰ってきたウルトラマン」の「ウルトラマン 夕陽に死す」を観ました。出た!新マンの最大のトラウマ回です。郷隊員の恋人であるアキと、坂田兄がナックル星人に殺されます。しかも二人の殺され方まで描写して、よく子供番組でこんなひどい脚本が書けたなと思って脚本家を調べたら、上原正三でした。セブンの時にもガッツ星人が怪獣を使ってセブンの能力を分析して倒す、というのがありましたが、このエピソードは本当にひどいです。またブラックキングとナックル星人に挟み撃ちにあって苦戦し、太陽エネルギーを欲するけど、夕日では光が弱すぎて、というのもリアルタイムで観ていた時にはせつなく感じたことを覚えています。まあこの回があったから次の回のカタルシスが大きい、ということはありますが、今観てもそれにしても…です。

教養としてのデータサイエンス

最近、データサイエンティストの養成が急務!とかいった論をよく見るので、データサイエンスに関する入門書を読んでみました。しかし悪い意味で予想が当たり、流行のIT用語を浅く広く紹介し、それに若干の統計学の初歩を付け加えただけの本でした。例えば実験計画法は注で2行の説明だけ。マハラノビス距離についてはまったく出て来ません。私には先日のDatabricksのセミナーでの大企業でのビッグデータとの格闘の例の方がはるかに参考になりました。

また、こんなの読むくらいだったら昔の数理統計学の本を読んだ方がよっぽどマシだとも思いました。写真は元々亡父(元高専の数学教師)の本で、私が情報処理技術者試験の一種を受ける時に、待ち行列などの参考書として持ち出したものです。1950年代後半から1960年代にかけての本です。

スター・トレック・ザ・ネクスト・ジェネレーションの”Conspiracy”

スター・トレック・ザ・ネクスト・ジェネレーションの”Conspiracy”を観ました。ピカード艦長は、ある夜突然USSホレーショの艦長のウォーカー・キール艦長より、秘密回線での連絡をもらいます。ウォーカーはピカードの旧友です。ウォーカーは面と向かって話したいことがあるということで、ある廃れた鉱山のある惑星を指定します。そこにピカードが行くと、ウォーカー以外に2人の別の艦長が待っていました。ウォーカーによると、連邦の幹部達の間から、ここ数ヶ月おかしな命令が発せられており、何かの陰謀が進行しているから気を付けるように、ということでした。その会見の後、元の目的の星に向かう途中で、USSホレーショが何者かによって完璧に破壊されているのを発見します。ピカードはこの陰謀を暴くため、地球に戻ることを決意します。地球では3人の司令官からピカードとライカーがディナーに招待されます。その内の一人のクイン提督はエンタープライズにやって来ますが、突然ライカーをものすごい力で襲います。別人のようなクインはラフォージュとウォーフまで倒しかけますが、クラッシャー医師がフェーザーで気絶させます。クラッシャーがクイン提督の身体を調べると、頭の後ろに何かの昆虫のようなものが入り込んでクインを操っていました。一方地球ではディナーが始ろうとしていましたが、そのメインディッシュはボールに山盛りの毛虫でした。つまり他の2人も何かの昆虫に既に操られていました。遅れてディナーに参加したライカーは、自身も昆虫に操られている振りをしながら、フェイザーで他の2人を倒します。ピカードとライカーは、逃げる昆虫を追って、クインの部下のラミック(前のエピソードでエンタープライズ号の犯罪を捜査に来た人)の部屋にたどり着きます。そこではラミックが巨大な虫を食べていました。二人はフェイザーでラミックを撃ち、中から映画のエイリアンのエイリアンそっくりのが出てきます。このエイリアンが昆虫エイリアンを操っていました。ピカードとライカーが何とかフェイザーでこのエイリアンを倒して目出度し、という話です。
連邦の中に陰謀があって、という話はいいと思いますが、それが単に何かに操られていて、というのはちょっと幼稚過ぎるように思います。虫を食べようとしたりグロテスク趣味が勝ったエピソードでした。

生成AIとConceptBase

ジャストシステムが2000年~2005年頃に販売開始した製品にConceptBaseというのがありました。
一言で言えば、類似文書検索システムです。ある文書と良く似た内容の文書を社内の文書ライブラリーから探して来るとか、FAQシステムとして、何かの不具合の解決方法を書いた文書を探すとか、そういうためのものでした。
その基礎になっている技術は、マハラノビスの汎距離と言って、ある文書の中の名詞系の語彙だけを抜き出し、それらの語彙に対して一種の分類を行い、分類の種類を一つの座標軸にし、単語の出現回数によって多数のベクトルを持った多次元ベクトル空間を作り、その重心を取ります。類似文書とはつまりその重心同士の距離が短いということになります。
これって実は今話題の生成AIのEmbeddingと呼ばれる技術そのものです。ただConceptBaseの頃は名詞系の語彙だけで多次元ベクトル空間を作りましたけど、今はトークンと呼ばれていますけど、名詞系以外の形態素も含めて分類情報を与えているのだと思います。
ちなみにChatGPT4にマハラノビスの距離とEmbeddingが関係あるか聞いてみました。回答はやはりその通りでした。

Q: 生成AIのEmbeddingは、マハラノビス距離と関連がありますか?

A: ChatGPT
はい、マハラノビス距離と生成AIのembeddingには関連があります。マハラノビス距離は、特徴空間において、データの分布を考慮して2つの点またはデータセット間の距離を測定する方法を提供します。生成モデルのembeddingは、高次元データを低次元空間にマッピングし、データ間の関係を捉える役割を果たします。
具体的には、生成モデルが学習する過程で、データの内部構造やデータ間の関係を学習し、これらの情報を低次元のembedding空間にエンコードします。マハラノビス距離を利用することで、この低次元空間においてデータ点間の相対的な距離をより適切に計算し、クラスタリングや異常検知、類似度計算など多くのタスクを効果的に行える可能性があります。マハラノビス距離は、特にデータの分布が正規である場合や共分散行列が利用可能な状況で有用です。

ちなみにこのマハラノビス距離は、品質保証の分野でも、田口メソッドと組み合わせたマハラノビス・タグチ法として、機械などの運用中に起こりうる不具合の時期を予測する技術としても使われています。

セイカ食品の兵六餅

これも取り寄せてみました。鹿児島のセイカ食品のボンタンアメと並ぶお菓子である「兵六餅」です。ボンタンアメと比べるとちょっとマイナーで、これまで買ったことはありませんでしたが、食べてみるとこれはなかなかですね。ボンタンアメと同じく求肥を使った朝鮮飴のバリエーションですが、兵六餅はきな粉、抹茶、海苔、餡などを入れていて味が複雑でなかなか面白いハーモニー感があります。ネーミングとパッケージの絵は、鹿児島に伝わる「大石兵六夢物語」という民話にちなんでいます。