ジャストシステムが2000年~2005年頃に販売開始した製品にConceptBaseというのがありました。
一言で言えば、類似文書検索システムです。ある文書と良く似た内容の文書を社内の文書ライブラリーから探して来るとか、FAQシステムとして、何かの不具合の解決方法を書いた文書を探すとか、そういうためのものでした。
その基礎になっている技術は、マハラノビスの汎距離と言って、ある文書の中の名詞系の語彙だけを抜き出し、それらの語彙に対して一種の分類を行い、分類の種類を一つの座標軸にし、単語の出現回数によって多数のベクトルを持った多次元ベクトル空間を作り、その重心を取ります。類似文書とはつまりその重心同士の距離が短いということになります。
これって実は今話題の生成AIのEmbeddingと呼ばれる技術そのものです。ただConceptBaseの頃は名詞系の語彙だけで多次元ベクトル空間を作りましたけど、今はトークンと呼ばれていますけど、名詞系以外の形態素も含めて分類情報を与えているのだと思います。
ちなみにChatGPT4にマハラノビスの距離とEmbeddingが関係あるか聞いてみました。回答はやはりその通りでした。
Q: 生成AIのEmbeddingは、マハラノビス距離と関連がありますか?
A: ChatGPT
はい、マハラノビス距離と生成AIのembeddingには関連があります。マハラノビス距離は、特徴空間において、データの分布を考慮して2つの点またはデータセット間の距離を測定する方法を提供します。生成モデルのembeddingは、高次元データを低次元空間にマッピングし、データ間の関係を捉える役割を果たします。
具体的には、生成モデルが学習する過程で、データの内部構造やデータ間の関係を学習し、これらの情報を低次元のembedding空間にエンコードします。マハラノビス距離を利用することで、この低次元空間においてデータ点間の相対的な距離をより適切に計算し、クラスタリングや異常検知、類似度計算など多くのタスクを効果的に行える可能性があります。マハラノビス距離は、特にデータの分布が正規である場合や共分散行列が利用可能な状況で有用です。
ちなみにこのマハラノビス距離は、品質保証の分野でも、田口メソッドと組み合わせたマハラノビス・タグチ法として、機械などの運用中に起こりうる不具合の時期を予測する技術としても使われています。




「帰ってきたウルトラマン」の「夜を蹴ちらせ」を観ました。吸血鬼と化した謎の女性の正体は、心臓麻痺で死んだ若い女性で、父親がその姿をそのまま止めておこうとして火葬にせず洞窟の中に安置していたのを、宇宙人に利用されて…という話です。何と言うかあまりにドラキュラ伝説そのままでもう少し捻りが欲しいです。で巨大化した宇宙人が「ドラキュラス」でそのまんま。ウルトラマンは血ならぬエネルギーを吸い取られてほとんど倒れかけますが、万能ブレスレットで強力な光を発し、ドラキュラスが弱った隙に今度はブレスレットを十字架状の槍に変えて、ドラキュラスの胸に突き刺して倒します。再度までドラキュラの設定に寄りかかりすぎです。
トワイライト・ゾーンの”Valley of the Shadow”を観ました。新聞記者のフィリップ・レッドフィールドはある日道に迷い、ガソリンを入れるために偶然ピースフル・ヴァリーという町にたどり着きます。そこで彼が連れていた犬が女の子が操る何かのマシンで消されてしまうという事件が起きます。彼がそれをその女の子の父親に詰め寄ると、その男は犬は裏庭にいると言って、やはり同じようなマシンを操り、彼の犬を出現させます。レッドフィールドは食べ物屋を探してその町のホテルに立ち寄りますが、そのホテルは客は誰もおらず、そこの新聞は1953年の非常に古いものでした。彼は車で町を出ようとしますが、突然車がクラッシュし彼の犬が死んでしまいます。現れた男たちによって彼はその町の町長のところに連れていかれます。それによるとその町は100年ほど前にある星のエイリアンがやって来て、地球の科学レベルをはるかに超えた科学をもたらし、町の人はその科学によって作られたマシンで何でも作ることが出来、あらゆる病気や怪我もそのマシンで治すことが出来ました。町長はこの技術が世界の他の人に知られると戦争に使われるため、この町だけの秘密になっていると言います。秘密を外に出さないため、レッドフィールドは町の住民になるように言われ、家を与えられます。しかしその回りにはフォースフィールドが張り巡らされ、彼は一種の囚人と同じでした。しかしホテルで知り合った女性が彼を好きになり、彼が逃げ出す手伝いをします。レッドフィールドは何でも作れる機械で銃を作り、町長達3人を撃って逃げようとします。しかし彼が盗み出した秘密を書いたノートは白紙でした。結局、彼は罠にはめられて試され、銃を使ったことでやはり暴力のためにこの力を使ったとされ、処刑されます。その処刑とは記憶を消されて町を出て行くことでした…
