KNOWLEDGE - COLUMN ナレッジ - コラム

論文の頻出キーワードからみる2023年の「AIトレンド」

コラムイメージ

関連するソリューション

業務改革

AI

エバンジェリスト・フェロー 玉越 元啓
顔写真

今回は、「2023年人工知能学会からみるAIのトレンド」をテーマにお送りします。
下の画像は、今回の学会で発表された論文の頻出キーワードをもとに作成したワードクラウドです。

気になる用語は入っていますか?


自作のワードクラウド

2023年度人工知能学会全国大会(第37回)について

人工知能学会は、AIに関する日本最大級の学会のひとつで、毎年、会員の研究成果の発表会が行われます。

今年は、2023年6月6日(火)~6月9日(金)の4日間、全国大会が開催されました(一昨年・昨年度の様子はこちらからご覧ください。「2021年のAIトレンドとその活用例」、「2022年度人工知能学会からみるAIトレンド」)。

今年は昨年度と同様に、会場とオンラインの同時開催となりました。オンライン開催となることで、聴けなかった発表を後から視聴できるようになったことは非常にありがたいです。

学会で論文が発表されてから実用化されるまでに、およそ2~3年のタイムラグがあります。物理的なデバイスの開発が必要な場合はもう少し時間が必要になるケースも多いです。
 
これは日本に限ったことではなく、海外でも同じようです。このことは、2~3年後にあらわれるサービスや技術の卵が学会で発表がされている、とも言えます。

今年度発表された論文の傾向をみることにより、今後の人工知能に関するトレンドを掴むことができるので、是非知っていただきたいです。

発表論文のトレンド

今回の分析方法

一口に人工知能と言っても、発表内容は非常に多岐にわたっており、傾向分析する切り口も幾つも考えられます。人工知能学会での発表形式も、論文の他に、パネル展示、企業によるデモ、討論会など多岐にわたっています。

今回は、パネル展示や討論会などを除外し、予定稿が投稿されている658本の論文からキーワードを抽出し、そのランキングをつくってみました。各論文2~4程度のキーワードがあり、計2093件の集計になります。

まずはランキングを紹介し、頻出のキーワードと個人的に興味を持ったいくつか具体的な研究内容を紹介していきます。今回初めてでたワードなどは、私自身が理解しきれていないこともあり、またの機会に紹介させていただきます。

順位 キーワード データの個数
1 深層学習 40
2 強化学習 35
3 機械学習 34
4 自然言語処理 18
5 世界モデル 15
6 ニューラルネットワーク 13
7 ヒューマンロボットインタラクション 12
8 対話システム 11
8 GPT 11
10 大規模言語モデル 10
11 異常検知 9
11 画像生成 9
※2023年度人工知能学会全国大会(第37回)にて、予定稿が投稿されている658本の論文からキーワードを抽出し、独自に作成


キーワード解説

深層学習、強化学習、機械学習、ニューラルネットワーク

深層学習(ディープラーニング、DL)は、強化学習やニューラルネットワークに代表される機械学習の技術の他に畳み込み、演算なシミュレーションなどの技術を組み合わせて、複雑な機能を実現する人工知能の形式です。
 
深層学習やニューラルネットワークの概要については、以前の記事(「ディープラーニングに対する誤解」)をご覧ください。

たとえば、 プロの棋士に勝利した囲碁のAIであるAlphaGOは、深層学習の成果の一つですが、これは、モンテカルロシミュレーションと強化学習を組み合わせてつくられています。

自然言語処理、対話システム、GPT、大規模言語モデル、ヒューマンロボットインタラクション

大規模言語モデルの登場によって、翻訳・質問応答・プログラムの自動生成などの様々なタスクを高い精度で解決することができるようになっています。
 
特に、昨年秋に公開されたChatGPT は、高い文章生成性能を備えており世界的に注目を集めています。


出典:「大規模言語モデルを補助に用いた言語指示ロボット学習のタスク汎用性の分析」より


「大規模言語モデルを補助に用いた言語指示ロボット学習のタスク汎用性の分析」では、ロボットにとって複雑なタスクを解くための手順を、大規模言語モデルへのプロンプティングを通して獲得・補助情報としてロボットの制御モデルに与えることで学習を促進する研究が発表されていました。
 
たとえば、床に落ちているモノを掴んでゴミ箱に捨てる人にとっては単純な作業であっても、人間は常識的な知識を持っていますが、重力やゴミの特徴などの事前知識を持たないロボットは、学習するために多量のデータと時間を必要とします。
 
一方、大規模言語モデルは、ウェブ上の大量のテキストデータから学習されているため、人間が持つ常識的な知識を背景に持っています。こうした「常識」を言語モデルから獲得しようとする試みがなされています。

世界モデル

世界モデル(World Models)は、センサー等で得られた限られた情報から外部環境をモデル化することで、仮想現実(VR)や拡張現実(AR)の裏側で使用されている技術・理論です。
 
世界モデルを使うことで、将来の外界の状態や観測を予測するなど、AIの学習に活かされています。普段目にする天気予報の予想図や台風等の進路予想も、地球環境の世界モデルにもとづいて計算されています。
 
現実世界ではさまざまな制限が加わる難しい作業も、仮想環境であれば、容易に実行できることを実感できます。
 
繰り返し実行するためのリードタイムの短縮、物理的な資材を使用しないことによるコストダウン、再現や記録が容易にできることなどが大きな利点となっています。



出典:「多視点カメラ画像のゲート付き対照学習に基づく実ロボット行動生成」より


「多視点カメラ画像のゲート付き対照学習に基づく実ロボット行動生成」では、外部環境の情報を多視点で取得し,状況に応じた行動生成が可能な知能ロボットの実現の検証がなれています。

画像生成、異常検知

以前のコラム(「AIによる画像生成の実力に迫る」)でご覧いただいたとおり、AIは既に人と変わりないレベルで画像を生成できるようになってきています。
 
課題とあげるとすれば、マンガのキャラクターのような一貫性のある複数の画像を生成しづらいことや悪意を持った活用にあると考えます。

今回の学会では、フェイクメディアとして悪用されているディープフェイク動画像を検出する技術障害のある人の文化芸術活動における人工知能技術の活用など、幅広い分野において、画像生成するAIについての発表がありました。


出典:「抽象的な商品情報を学習したCVAEに基づく商品画像生成モデルの提案」より


「抽象的な商品情報を学習したCVAEに基づく商品画像生成モデルの提案」では、商品説明文に含まれる抽象的な情報を活用した商品画像を生成することで、顧客ニーズの中に含まれる具体的な属性だけでは表現しきれない抽象的なニーズに応えようとする試みがされていました。

全体をとおして

昨年もお伝えした通り、発表の中には、「仮説を検証しようとしたが、うまくいかなかった」という一見すると失敗と思われる事例もあります。しかし、これは失敗ではなく、同じ轍を踏まないよう情報を共有するという歴史の新たな1ページとなる発表なのです。
 
様々な研究者が未開の地を探索して情報を共有し、少しずつ地図を作っていく。その中で、「この場所はこの方法では乗り越えられなかった」という情報は、新たな探検の指標になります。
 
上手くいかなかった内容の発表は、後続の研究者の指標にもなり、学会のこうした論文の選出からは、関係者全員で前に進む、という強い意思を感じます。
 

AIを活用するときの注意点
AIを学ぶ研修はいくつもありますが、AIを自分で開発したいのか、AIを使いたいのか、リスクマネジメントしたいのか、によって受講する研修を選んでいきましょう。
AIに関する主要な研修について比較・解説をしたコラムもございますので、参考にしてみてください。


当サイトの内容、テキスト、画像等の転載・転記・使用する場合は問い合わせよりご連絡下さい。

エバンジェリストによるコラムやIDグループからのお知らせなどを
メルマガでお届けしています。

メルマガ登録ボタン


玉越 元啓

株式会社インフォメーション・ディベロプメント フェロー

この執筆者の記事一覧

関連するソリューション

業務改革

AI

関連するナレッジ・コラム

AI倫理~AIとの向き合い方と制度~

生成AIのトレンド「LLM+RAG」を解説

画像生成AIでキャラクターを作ってみる version 2