ChatGPT―話題性で金になるAI(改版)

表面的なというか宣伝のような話ばかりが目について、ITやAI関係のニュースを追いかける気がなくなってしまった。随分前から生産ラインでも使われているし、大きな組織では当たり前になっていることを、アルファベットの略語やカタカナで呼んで、あたかも新しい技術にみせようとしてのことじゃないかと勘繰ってしまう記事も多い。時代にとりのこされた年寄でいいじゃないかと思ってはいるが、なかには気になるものもある。
最近ChatGPTに関するニュースが飛び交っているのに気がついた。なんのことかと思えば、また話題性で一儲けと企んでいるヤツらが仕掛けたことにしかみえない。

ChatGPT、宣伝文句(?)をみると、次の時代を担う検索エンジンのような気がする。Chatbotの開発が始まったのは随分前だけど、汎用の情報ツールとして実用化されるのは、まだまだ先のことだろうと思っていた。まさか、もう使い始められている?そりゃないだろうと思いながら、Webで情報を漁ってみた。なんのことはない。発端はマイクロソフトが登場したことだった。
マイクロソフトは検索エンジンBing(市場シェア10%未満)の劣勢を一挙に挽回する策として、OpenAIを吸収してBingにChatbotの機能を付けるといいだした。Googleは焦った?といよりマスコミと金融が騒いで、Googleの株価が急落して、マイクロソフトの株価は急騰した。実際に使えるものかどうかに関係なく、話題になれば巨額の資金が動くという、相も変わらずAIのバカ騒ぎがまた起きた。

ChatGPT、一言で言ってしまえば、検索エンジンにAIを駆使して開発したChatbot機能を持ち込んだアプリケーションソフトウェアということになる。Chatbot?と思うかたも多いだろう。Googleで「チャットボット」と入力して検索すれば、表示の一番上に業界の方のわかりやすい説明がでてくる。業界違いが手を入れるもの失礼だろう。そのまま書き写して置く。urlは下記の通り。
https://it-trend.jp/words/chatbot

「チャットボット(chatbot)」とは、「チャット」と「ボット」を組み合わせた言葉で、人工知能を活用した「自動会話プログラム」のこと。
「チャット」は、インターネットを利用したリアルタイムコミュニケーションのことで、主にテキストを双方向でやり取りする仕組み。ビジネス向けのクラウドサービスに「ChatWork」や「Slack」などがある。
「ボット」は、「ロボット」の略で、人間に代わって一定のタスクや処理を自動化するためのプログラムのこと。不正な処理がプログラムされればウィルスとなり、スマホアプリに組み込まれれば、パーソナルアシスタントなどの便利なツールにもなる。
人間同士が会話するチャットに対して、「チャットボット」は一方は人工知能を組み込んだコンピュータが人間に代わって対話することになる。このような仕組みは以前から存在していたが、あらかじめ人間によってパターン化された対応しかできず、人工無脳と揶揄されていた。

人工無能というのなら、機械学習も備えた最新のAI技術を活用して人工頭脳のチャットボットを開発すればいいじゃないか。誰でも思いつくことだが、特定の領域や特定の用途でも難しい開発途上の技術で、いつになったら「巷で汎用」として使えるものになるのか目途がたっていない。それを、マイクロソフトが、市場でほぼ忘れられている自社の検索エンジンBingに搭載しようということから、ChatGPT騒ぎが起きた。
ことの経緯も含めてわかりやすい説明がMITのTechnology Reviewにあった。二月十四日の記事で、タイトルとurlは下記の通り。
「Why you shouldn’t trust AI search engines」(AI検索エンジンを信用してはいけない理由―DeepLによる機械翻訳)
https://www.technologyreview.com/2023/02/14/1068498/why-you-shouldnt-trust-ai-search-engines/?truid=561860b6d80f5491abff191a94bccd9c&utm_source=the_download&utm_medium=email&utm_campaign=the_download.unpaid.engagement&utm_term=&utm_content=02-14-2023&mc_cid=54fedb3c9e&mc_eid=51de8a007b

記事の要点
「先週は、チャットボットを搭載した検索エンジンが登場するはずだった週でした。このAIボットは、現在の検索のようにリンクのリストを返すだけでなく、私たちの質問に対しておしゃべりな回答を生成し、ウェブ検索の体験を一新するというのが大きなアイデアでした。しかし......事態は計画通りには進まなかった」
「マイクロソフトが新しいChatGPTを搭載したBing検索エンジンを人々に公開してから約2秒後、人々はいくつかの質問に対して陰謀論などの不正確または無意味な答えを返していることに気づき始めたのです。Googleは、同社が開発したチャットボットBardの広告に事実誤認があることを科学者が発見し、その後株価が1,000億ドル下落するという恥ずかしい事態を経験しました」

「大ヒットしたAIチャットボット「ChatGPT」を開発したOpenAIは、『まだ研究プロジェクトに過ぎない』『人々のフィードバックを受けながら常に改善している』と常に強調している。それでもマイクロソフトは、検索結果が信頼できないかもしれないという注意書き付きではあるが、Bingの新バージョンに統合することを止めなかった」
「Googleは何年も前から、キーワードではなく文章全体を使ってインターネットを検索できるよう、自然言語処理を使っている。しかし、これまで同社は自社のAIチャットボット技術を看板の検索エンジンに組み込むことに消極的だったと、ワシントン大学でオンライン検索を専門とするチラグ・シャーは言う。グーグルの首脳陣は、ChatGPTのようなツールを急いで出すことによる『風評リスク』を懸念しているのだという」

「問題は、この技術がこのような規模で使用される準備が整っていないことです。AI言語モデルは悪名高いデタラメ野郎で、しばしば虚偽を事実として提示する。文中の次の単語を予測することには長けていますが、その文が実際に何を意味しているのかについては全く知りません。そのため、事実を正確に把握することが重要な『検索』と組み合わせるのは、非常に危険なのです」

ここで『検索』と言っているのは検索エンジンのことでGoogleのほぼ独占状態が続いる。Googleの検索エンジンは極端に言えばインターネット上でのアクセス数の多いものから順番にリストとして提示している。このアクセス数に基づくリストがインターネット上の検索作業を可能にしていると言っても言い過ぎではない。インターネット上のサイトを整理もせずにリストとして表示されても、あまりに多くのサイトが羅列されるだけで、利用者にはどのサイトを見たらよいのか分からない。分からないということはつかいものにならないということに他ならない。表示されたどのサイトを見るのか参考にするのかは、利用者の判断であり責任である。

検索エンジンにAIを活用した人工頭脳のチャットボットを組み合わせれば、インターネット上の様々な情報を整理して、利用者にこれですと一つの情報(回答)を提供できる。リストとして表示されたサイトをあれこれ見て、サイト上の情報を取捨選択、編集してという利用者がして来たことを検索エンジンがしてくれる。リストまでのGoogleより遥かに便利じゃないかと、誰しもが思う。ところがことはそう簡単じゃない。
ちょっと後ろにひいて想像してみたらいい。市井の人たちが日常生活で気になることをChatGPTを搭載したBingで問い合わせたら何が起きるか?大ざっぱに二つのケースが考えられる。ちんぷんかんぷんな答えが返ってきたら、使い物にならないで済むからいいが、問題は、もし一見体裁の整った、如何にも専門家の手による回答に見える場合にある。体裁は整っているだけに、利用者は内容の真偽を確認することなく、あるいはする能力がないから、回答をそのまま受け入れてしまう可能性がある。
例えば医者にいくには金がかかるからと健康相談の場合、有望な投資先はないかという相談……回答を真に受けると命に係わることもあれば、資産を失う危険性もある。それはAIがインターネット上のあらゆる情報を精査して判断した、もっとも正しい答えをだしたのですから、私どもマイクロソフトに責任はありませんとでもいうのか?それともそんな危険性を知りながら、規制をかけなかった行政の問題だとでもいうのか。
こんなことを言うと、ChatGPTの回答は、機械学習で世界中の信頼できる情報元から得た情報を整理して日々進化し続けているのだからと言い出す人もいるだろう。言っていることはわかるが、世界中の英知を収集して出した答えには剽窃の可能性さえある。剽窃にならないように上手に書き換えるまでにAIの知能が向上するのはいつのことになるのかわからない。
そのうえ、機械学習で情報を?き集めるのはいいが、中には犯罪やドラッグ、暴力や性犯罪、マネーロンダリングや詐欺、汚職にテロ……関する情報も拾ってくる。社会が必要とする情報や拡散を避けたい情報が世界中で画一的にこれと決まっているわけじゃない。宗教上の問題や人種や文化、しばし社会の常識が国や地域によって大きく違うこともある。例えばLGBTQや同性婚を許容しているところもあれば死刑に処す国もある。

どうやって拡散がゆるされない情報を排除しているのか?機械学習があればと簡単に思っている方々も多いだろう。
ソフトウェアの開発は、一語一語人が神経をすり減らしながらしているもので、巷で思われているようにすべてが知的集約産業ではない。低賃金で身を削る作業をしている人たちがいる労働集約産業の一面があることを知ろうとしない人たちが多すぎる。ここに一つの例がある。

Windows Centralという名のサイトに下記の記事がある。
「The human cost behind ChatGPT is worse than you think」(ChatGPTの背後にある人的コストは、あなたが思っているよりも深刻です。―DeepLによる機械翻訳)
https://www.windowscentral.com/microsoft/the-human-cost-behind-chatgpt-is-worse-than-you-think

要点を機械翻訳した。
「サンフランシスコのSamaという会社が、ChatGPTの安全システム構築にどのように協力したかを詳しく紹介しました。ケニアに拠点を置くSamaの従業員は、年功序列と業績に応じて、時給1.32ドルから2ドル程度だったと伝えられています」
「Samaはその後、無名のOpenAIプロジェクトで露骨な画像のラベル付けを任されましたが、後に合法性の懸念から契約から手を引き、OpenAIとの関係を絶ちました」
「この話は、始まったばかりのAI革命の背後にある人間への影響を強調し続ける」
「マイクロソフトはすでにOpenAIに10億ドルを投資しており、さらに100億ドルを投資する可能性がある。マイクロソフトはあらゆるものにAIを入れる計画で、BingでChatGPTを活用すると伝えられている」
「Samaはサンフランに拠点を置いているが、作業はケニアの労働者が行い、時給は1.32ドル、2ドル程度である。残念ながら、ユーザーにとってChatGPTを『安全』に保つために、OpenAIはインターネットから大量のデータを送り込む必要があり、それはすべてフィルタリングされていないものである。そこでOpenAIは(Meta with Facebookのような企業も)、人間を使って悪いものをすべてフィルタリングする代わりに、他のAIツールを採用して、データプールからそのコンテンツを自動的に削除します」

絵に描いたもちのような世界がここにある。全ての情報が自動的にフィルタリングできるわけではない。人がまるで手作業でもするかのようにして削除しているのは、児童への性的虐待、獣姦、レイプ、性的奴隷、死と暴力など、米国の法律で違法とされるものを含むテキストや画像。ときには諜報機関やテロにドラッグ関するものもあるだろうし、政治や宗教の闇に関係するものもある。こうした低賃金の労働集約的作業があってはじめて、そこそこ安心して使えるインターネットあって、ちまたでちやほやさえれるAIなるものがある。

どんなにWebが強力になったにしても、そしてAIが知的作業をしてくれたところで、すでにある情報を処理することしかできない。ない情報は検索しても見つからない。当たり前のことだが、ないものはない。どうもAIならすべてを処理できると勘違いしているようなニュースが目につく。

p.s.
卒論がコピペでというニュースがあったが、AIを活用した検索エンジンが世界中で似たような論文を生み出す日がくるかもしれない。 ことのついでに言わせていただくが、言葉が何を意味しているのかをはっきりしないと何を言っているのか書いてあるのははっきりしない。当たり前のことで反論はないだろう。ではロボットとはなんなのか?鉄腕アトムなどマンガの世界に登場するものをイメージしているわけではないと思うが、AI騒ぎが起きた途端、いくつもの新聞がロボットが失業を招くと言い出した。六十年代の後半には、今巷でロボットとよんでいるものに相当する装置が大量に使用されていたことを知ってのことか?と訊きたくなる。

撚糸機や精紡機では百年以上前にロボットとよんでも差し支えない装置が実用化されている。動画の3:40辺たりで糸継ぎらしき作業がされている。細い糸を撚ってボビンに巻き取っていくとき、ときには糸が切れてしまうことがある。女工さんが目を皿にしてみていても見落としかねない。恐らく糸の張力をチェックしていて、張力が亡くなったら糸が切れたと判断して、判断したヵ所に糸継ぎユニットが走っていく。上下の切れた糸を負圧で吸い込んで目にもとまらぬ速さでつないで、平常運転にもどる。
YouTubeで見れるのは最新鋭の設備でコンピュータを活用しているはずだが、糸継ぎという作業に変わりはない。
綿から糸ができるまで【紡績の工程】
https://www.youtube.com/watch?v=6E69zXAAgjA&t=233s

万博の年、七十年に鐘紡の工場で眼の前30cmほどの距離でみせてもらったが、動作が早すぎて何がどうなったのかわからなかった。年季のはいった機械で、コンピュータが搭載さえていたとは思えない。コンピュータ⇒AI⇒ロボットというながれじゃないことはあきらかだろう。コンピューターなんかなかった時代に、すでにロボットと呼べるものが実在していた。
2023/2/20