生成AIの機能を、なぜか何でもチャット画面に詰め込んでしまう——Smashing Magazineの記事は、こうした「会話への視野狭窄(conversational tunnel vision)」に警鐘を鳴らす。大規模言語モデルが対話データで学習されているからといって、あらゆる機能をチャットにする必然性はない。
チャットUIには固有の負担がある。入力面では、ユーザーは曖昧な考えを正確な言葉に翻訳しなければならない。作りたい画像をうまく言語化できないデザイナーを思い浮かべればよい。スライダーやドラッグ操作のような直接操作に比べ、余計な摩擦が生じる。出力面でも、長いテキストを順に読んで解釈する作業は認知的な負荷が高く、医療診断や金融取引のように一瞬の判断が求められる場面では、視覚的な表現のほうが適している。
記事は、意図に応 じてモダリティを選ぶ枠組みを示す。入力なら、手がふさがる現場では音声、単純な操作にはボタン、抜け漏れを防ぎたい場面ではフォームやウィザード、複雑なパラメータ設定にはGUIのつまみ、といった具合だ。出力も、一目で把握させたい通知、視覚的な比較に向くダッシュボード、反復的な制作に適したインタラクティブなキャンバスなど、目的に応じて使い分ける。
設計に先立って推奨されるのが「タスク監査」である。実際の作業環境を観察し、手の空き具合や画面の見やすさといった入出力の制約、すでにかかっている認知負荷、周囲の騒音やプライバシーといった社会的制約を洗い出す。そのうえで、意図とモダリティを対応づける。状況が変われば、音声入力から視覚ダッシュボードへと自動的に引き継ぐ「適応的なハンドオフ」も有効だという。
結論はシンプルだ。「適切なモダリティの組み合わせは、その瞬間のユーザーの身体的・認知的な状態を尊重する」。慣習ではなく、観察に基づいて設計せよという主張である。2時間の現場観察、3〜5件のインタビュー、90分のワークショップ——この軽量な監査だけでも、思い込みではなく現実に根ざしたモダリティの選択ができるとしている。
出典: Matching AI Modality To User Intent: Designing The Right Interface









