カテゴリー: Cowork特有

  • Live Artifacts ー 毎朝同じ質問していた私の、卒業記念日

    Live Artifacts ー 毎朝同じ質問していた私の、卒業記念日


    つまりこういうこと

    毎朝、私は同じ作業をしていた。Coworkを開く。Gmailコネクタにつないで「未読のうち、件名に『請求書』が入っているものを教えて」と打つ。出てきたリストをメモ帳に貼る。Slackコネクタに切り替える。「昨日以降、自分宛のメンションある?」と打つ。出てきた結果をさっきのメモ帳に追記する。最後にスケジュールタスクの状況を聞いて、メモ帳の下に並べる。

    これを4月の頭からずっと続けていた。実時間にして毎朝7分。週で35分、月で2時間半。「これ自動化できないんですか」と何度もClaudeに聞いて、そのたびに「スケジュールタスクで毎朝メールに送ることはできますよ」と言われ、「メールで届くと結局Gmailを開くから、Coworkで開きたいんですよ」と返して、平行線。Live Artifactsという機能が4月20日に出ていたことを、私はその2週間後の今朝、ようやく知った。先に言っておくと、私が3週間ぶん損していた話である。


    結論マップ(ビフォー/アフター)

    場面これまでLive Artifactsを知った後
    朝の確認作業Coworkで毎朝3つのコネクタに同じ質問を投げ直す1ページを開くだけ、自動で再取得される
    結果の保存メモ帳に手で貼って、昨日のぶんは消える永続HTMLとして残り、セッションをまたいで再オープンできる
    カスタマイズ「並び替えて」と毎回お願いするフィルタや並び順は localStorage に記憶されて、次に開いても残る

    要約すると、「一度しか使わない回答」が「再利用できるダッシュボード」に化ける機能だった、ということだ。3週間ぶんの平行線、いま回想すると恥ずかしい。


    要するに何ができるか

    Live Artifactsは、Coworkが作ってくれる 「永続するHTMLページ」 のこと。普通のチャット回答との一番の違いは、開きなおすたびに、つないでいるコネクタから最新データを引っ張ってきて自分で再描画する点にある。

    公式ヘルプセンター(support.claude.com)の説明を私の言葉でまとめ直すとこうなる。Coworkに「毎朝のチェック用ダッシュボードを作って」と頼むと、ClaudeはMCP(Model Context Protocol、ClaudeとGmail・Slack・Notionなどをつなぐ共通規格)の許可されたコネクタにアクセスして、HTMLとJavaScriptが詰まった単一ページを生成する。そのページは Coworkの中に保存され、サイドバーから何度でも再オープンできる。再オープンするたびに、HTML内のJavaScriptがコネクタを叩き直し、画面の数字や一覧が更新される。

    つまり、一回限りの「答え」ではなく、そのまま使えるツールが手元に残るということだ。今までのチャット回答は、優秀なバイト君に毎朝「同じ仕事を頼む」状態だった。Live Artifactsは、その仕事を1ページの紙にまとめて壁に貼って、データの部分だけが毎朝勝手に書き換わる ー そういう違いがある。たとえはちょっと変だが、二宮金次郎の像が毎朝勝手に違うページの本を読んでいる、みたいな話で、「そこにいてくれる」のが地味にありがたい。

    💡 覚えておきたい1点:Live Artifactsは「中の処理」が動くページなので、つなぎ先のコネクタが切れている/権限が外れていると、開いても空っぽになる。これは後の「ここで止まった」で詳しく書く。


    とりあえずやってみる

    セットアップは、設定ファイルを書く系の作業ではなく、Coworkに普通に頼むだけだった。拍子抜けするくらい短い。

    1. Coworkを開いて、新しいセッションを始める(既存のセッションでも動くが、最初は混乱を避けるため新規がおすすめ)
    2. つなぎたいコネクタ(Gmail、Slack、Calendarなど)が「接続済み」になっていることを確認する。MCPの一覧画面でコネクタ名の横に緑のチェックが出ていればOK
    3. 毎朝チェック用のLive Artifactを作って。Gmail(未読件数)・Slack(メンション)・スケジュールタスク(次の起動予定)を1ページにまとめて。」のように、何を・どのコネクタから・どう並べたいかを1メッセージで伝える
    4. Claudeが下書きを生成し、サイドバーに「Open Artifact」ボタンが出る。これを押すと別パネルでHTMLページがレンダリングされる
    5. 1回目のオープン時に、各コネクタへのアクセス許可が確認される。「Approve」を押すと以降は自動取得(次回以降は許可不要)

    何を・どのコネクタから・どう並べたいか」を最初から一文で伝えるのが一番のコツだった。私は最初これを「Gmailの未読を見せて」と短く頼んでしまい、ただの一回限りのリストが返ってきて「あれ、永続化されてない」と慌てた。Coworkにとって「ライブアーティファクトとして作って」というキーワードが入っているかどうかは、要件の重みになる。


    実際に打ったプロンプト

    私が今朝、最終的に動いた状態にたどり着いたプロンプトはこれだ。コピペして自分の用途に合わせて書き換えて使ってほしい。

    毎朝チェック用の Live Artifact を作ってください。
    【含めるもの】
    1. Gmail:未読のうち、件名に「請求書 / invoice / 領収書」を含むスレッドを上から5件
    2. Slack:直近24時間で自分宛のメンションを上から10件(スレッド名・送信者・本文の冒頭60字)
    3. スケジュールタスク:次に起動予定のタスク名と起動時刻を3件
    【表示の希望】
    - 1ページ縦並び、各セクションに見出しをつける
    - 件数が0件のセクションは「なし」と1行だけ表示
    - ページ上部に最終取得時刻を「YYYY-MM-DD HH:mm:ss」形式で表示
    - 並び順の好み(新しい順/古い順)は localStorage に記憶し、次回開いた時に復元
    【外部ライブラリ】
    - Grid.js を使ってよい(テーブルの並び替え用)
    - それ以外のCDNは不要
    ボタンや派手な装飾は要りません。シンプルなテキストとリストで。

    💡 コツ:「ライブアーティファクトとして作って」と明示するのと、要件をブロックごとに区切って書くのがポイント。フリーフォーマットで頼むと「一回限りの整形済みリスト」を返してくることがあって、それは Live Artifact ではない。

    うちの環境ではこれで一度で通った。プロンプトが長く感じるかもしれないが、毎朝7分かかっていた作業を一度きりの2〜3分の入力で永久に置き換えられると思えば、たぶん人類で一番割の良いタイピングだ。


    ここで止まった

    私が3週間損していたのには、それなりの理由がある。実際にやってみて、躓いたポイントを順に書いておく。

    • コネクタが繋がっていないと「ただのHTML」になる: 1回目に開いたとき、Slack部分だけ真っ白だった。理由はSlackコネクタが先週外れていたのに気づかず、再接続せずに作ってしまったから。Live Artifacts自体はちゃんと作られているのだが、中身を取りに行くMCPの先が無い、という状態。コネクタの接続状態は作る前にMCP一覧画面で点検しておくと事故が減る。これは私の落ち度で、Coworkは何も悪くない
    • 使えるCDNライブラリが3つに限定されている: 公式ヘルプを読み返したら、Live Artifacts内から外部読み込みできるのは Chart.js・Grid.js・Mermaid の3つだけだった。私は最初「D3.jsで凝ったグラフを」と言ってしまって、「使えないよ」とClaudeに止められた(その場で素直に止めてくれて助かった)。CSSやJSの自前コードはインラインで書くぶんには制限なしだが、CDN読み込みはこの3択。過剰な期待をしないほうが、生成速度も安定する
    • localStorage 以外のブラウザストレージは使えない: フィルタや並び順を覚えてほしい場合は localStorage を使う、と書いておけば動く。ただし sessionStorage ・IndexedDB ・Cookieはサポート外で、書いてもらっても動かない。私は一度「Cookieに保存して」と頼んでしまい、見た目は動くのに次回開くと忘れている、という現象に遭遇した(サンタを信じない子どもみたいで悲しかった)
    • 「Open Artifact」を押し忘れる: 一番くだらない躓きだが、私は最初、Coworkのチャット欄に出てきた「Open Artifact」ボタンを押さずに、そのページが普通のチャット返答だと思って閉じてしまった。Live Artifactsは専用のサイドパネルでレンダリングされて初めて中のJavaScriptが動く。チャット欄に見えているのは、ただの予告編である

    3行でまとめると

    Live Artifactsは、「毎日同じ質問をしていた作業」を一回の依頼でページに固定できる機能。コネクタにつないだ最新データを、開きなおすたびに自分で取り直す ー そういう仕組みのHTMLが、Cowork内に残る。永続するから、ブラウザを閉じても明日も明後日も同じ場所から開ける。

    「同じ質問を3回した時点で、これライブアーティファクト化できないか?」と疑うクセを、まずつけたい。3週間ぶん損した私からのお願いである。チャット回答が消えていく流れ星なら、Live Artifactsはずっと光っている街灯みたいなもので、毎朝の足元を照らしてくれる方が、どう考えてもありがたい


    関連リンク


  • auto-memory ー 私の口癖、勝手に覚えていてくれた

    auto-memory ー 私の口癖、勝手に覚えていてくれた


    気づいたら使ってた

    同じ説明を3回した。「Windows 使ってます」「PowerShell で動かしたいです」「日本語でお願いします」。テンプレ自己紹介、もはや営業の名刺交換みたいでした。4回目の朝、私がまだ何も言ってないのに、Claude が PowerShell コマンドを並べて出してきた。何これ、誰が教えた。下手な探偵より私のことを知っている。トースターが昨日のこんがり度を覚えていたような、ちょっと嬉しいけれど不気味さもある朝でした。


    結論マップ(ビフォー/アフター)

    並べてみると、昨日までの自分がちょっと気の毒です。

    項目auto-memory なし(私の昨日まで)auto-memory あり(私の今)
    自分のプロフィール会話の冒頭で毎回口頭で説明1回言えば次回から覚えている
    プロジェクトのクセ毎回 CLAUDE.md に追記Claude が適宜 markdown に保存
    「前にこう言ったよね」履歴を遡って自分で探すClaude が勝手に持ち出してくる

    要するに何ができるか

    auto-memory(オートメモリー)は、Claude がセッションをまたいで「あなたとの会話で得た学び」を自分で markdown ファイルに書き残してくれる機能です。専門用語に翻訳すると「セッション間でユーザー固有情報を永続化する仕組み」、人間の言葉に翻訳すると「私の口癖と好みを Claude が勝手にメモる」。後者のほうが10倍わかりやすい、と書きながら思いました。Claude Code v2.1.59 以降は最初から ON で、プロジェクトごとに ~/.claude/projects/<project>/memory/ 以下に保存されます。中身はぜんぶ markdown なので、私が直接読めるし、編集も削除もできる。「AIに記憶される」と聞いたとき頭に浮かんだ、何かこう、暗号化された謎ファイルみたいなものは一切なし。拍子抜けするくらい開けっぴろげです。

    💡 「全部 markdown」というのが地味に効く。AI が裏でこっそり何か覚えているのではなく、フォルダを開けば全部見えるところに置いてある。怖さの正体は「見えないこと」だったんだなと、覗いてみて気づきました。


    とりあえずやってみる

    1. ターミナルで claude --version を実行し、バージョンが v2.1.59 以上 か確認する(古ければ npm install -g @anthropic-ai/claude-code で更新。私はここで更新を3日先延ばしにした人間です)
    2. Claude のセッション内で /memory と打つ
    3. 表示されるメニューで「Auto memory」が ON になっていることを確認する(デフォルト ON。ここでオフにしたら振り出しに戻ります。人生ゲームみたいですね)
    4. あとは普通に会話する。私の好み・作業習慣・つまずきパターンを Claude が「これは次回も役立ちそう」と判断したときだけ自動で保存する。判断は Claude 任せです。「これも覚えて!」と叫んでも基本スルー(経験談)
    5. 数日経ったらもう一度 /memory を開いて、Auto memory フォルダの中身を覗く。ここで自分の口癖と再会します

    こう書いたら動いた

    ある朝、何気なく ~/.claude/projects/my-recipe-app/memory/ を覗いたら、こんなファイルが転がっていました。私は頼んでいない。Claude が勝手に書いていた。プライバシーの侵害だと思ったけど、内容を見たら正論しか書かれていなかったので何も言えなくなりました。

    ---
    name: User PowerShell preference
    description: ユーザーは Windows + PowerShell ユーザー
    type: feedback
    ---
    ユーザーは PowerShell をメインシェルとして使用している。
    bash や zsh の構文を提示するたびに「PowerShell で書き直して」と依頼されるため、
    ターミナルコマンドは最初から PowerShell 構文で提示すること。
    例:
    - NG: `ls -la`
    - OK: `Get-ChildItem -Force`

    💡 私の3回分の小言が、フィードバック型のメモにきれいにまとまっていた。鳥肌が立ったというより、上司にこっそり手帳を覗かれた気分でした。でもこの上司、メモを取っておいてくれるおかげで明日の私の朝食の手間が減る。許す。


    私が間違えたこと

    • 「これ覚えて」と言えば全部覚える、ではない: Claude が「次回も使えそう」と判断したものだけが保存されます。完璧な秘書ではなく、ややマイペースなメモ魔の同僚に近い。覚えてほしいなら明示的に「これメモしておいて」と頼むほうが確実です。私は「絶対忘れないで!」と3回叫んで、3回ともスルーされました
    • 記憶は勝手に消えない: markdown ファイルはユーザーが消すまで残ります。半年前の古い情報を Claude が信じて間違ったコマンドを出してくることもあるので、月に1回はフォルダを覗いて掃除する。冷蔵庫の奥のタッパーと同じです
    • CLAUDE.md と auto-memory を混同しない: CLAUDE.md は私が手で書く「ルール」、auto-memory は Claude が自動で書く「学び」。書き換える場所を間違えると、せっかくのメモを上書きしてしまう。役割分担、ここ大事です(試験に出ます)

    使ってみての正直な感想

    同じ説明を3回繰り返している自分に気づいたら、auto-memory が動いているか覗いてみる価値があります。私はもう「Windows です、PowerShell です、日本語で」のテンプレ自己紹介を毎朝しなくて済むようになりました。ボルヘスの「フネス」みたいに何でも覚えていたら逆に動けなくなりそうですが、Claude の auto-memory は「忘れる」ほうも上手です——本当に必要なものだけ拾ってくれる。怖いと思っていた「AIに記憶される」も、フォルダを開けば全部 markdown で見えるとわかった瞬間、急に気が楽になりました。秘密にされるより、見えるところに置いてくれるほうがずっと信用できる。下手な探偵に追われる気分から、有能な秘書を雇った気分に、3週間で進化した話でした。


    関連リンク

  • Chat / Cowork / Code、それぞれ「新しく作る」タイミング ー 1つに全部詰めて、Claude を混乱させてた

    Chat / Cowork / Code、それぞれ「新しく作る」タイミング ー 1つに全部詰めて、Claude を混乱させてた

    「同じセッションで全部やったら、Claude が話題を見失った」

    ある日、ひとつの Cowork セッションで「英文メールの和訳 → Excel の整理 → 架空のスクリプトの修正」と立て続けに頼んでみた。詰め込みすぎたお弁当箱みたいなセッションです。
    3つ目に入ったあたりで、Claude が「先ほどのメールの件についてですが…」と、もう関係ない最初の話題を引っぱり出してきた。「先ほどの……って何ですか(こちらは Excel の話をしている)」。

    最初は「Claude が壊れたのかな」と思った。違いました。Claude は壊れてなくて、私が1つの場所に荷物を詰めすぎただけだった。要するに、引っ越し前日の段ボール状態です。何が入っているか、自分でも把握できていない。

    Cowork のサイドバーには「Chat」「Cowork(New task / セッション)」「Code」という3つの入口があり、それぞれ何を覚えているか(コンテキスト)が違う。新しい話を始めるたびに「これは続きにすべきか、新しく作るべきか」を判断するクセを付けてから、誤動作がぐっと減った。「クセを付けた」と書きましたが、実態は「やらかした回数だけ学んだ」です。


    なぜ「新しく作る」を意識するのか

    Claude は会話を続けるほど、その会話の中身を覚えていく。便利なんだけど、過去の話題が混ざると判断がブレる。便利の裏には、たいていトレードオフがいる。
    たとえば「Excel ファイル A」を読み込ませた直後に「画像を生成して」と頼むと、Claude は「Excel に貼る用の画像かな?」と勝手に推測してしまうことがある。気を利かせてくれているんですが、こっちは普通に SNS のアイコンを作りたかっただけです。私はこれを「コンテキストの引きずり」と呼んでいる(命名するほどには遭遇している)。

    加えて、長い会話はトークン(Claude が一度に扱える文章量の単位)を食う。動作も重くなるし、料金もかさむ。お腹いっぱいの Claude は、判断もちょっと鈍る——そんな気がしている。話題が変わったら新規にする、というのは「自分のためでもあり、Claude のためでもある」操作になっている。たぶん Claude も、毎回まっさらな机で仕事を始めたいはず。


    3種類 × 新規作成すべきタイミング

    ここで一旦整理。「だから何を、いつ新しくすればいいの?」という話を表にしました。

    種類主な使い道コンテキストの中身新しく作るべきタイミング
    Chat質問・即答・短文生成そのチャット内の会話履歴(必要に応じてチャット検索やメモリも参照される)。ファイル操作や MCP 連携は行わない話題が変わったら、迷わず新規。コストが軽いので「1質問1チャット」でも問題ない
    Cowork セッションファイル操作・MCP 連携・複数ステップ作業読んだファイル・実行したツール・出した結論対象プロジェクトやフォルダが変わるとき。失敗から始め直したいとき。長くなりすぎたとき
    Code セッションリポジトリ(=コードを置いてあるプロジェクトのフォルダ)単位のコーディングCLAUDE.md・git の状態・開いているリポジトリリポジトリを切り替えるとき。ブランチ運用で文脈が大きく変わるとき

    💡 補足: Cowork セッションは作業を後で続けられる設計。同じテーマの追加作業なら新規にせず、続きから頼む方が記憶を再利用できて速い。「昨日の私の続き」を今日の Claude が拾ってくれる感じで、地味にうれしい。
    一方で別テーマを始めるときは、続きにせず新規にした方が安全。引き継がせると、たまに昨日の経費の話が顔を出してくる。


    判断フロー(私の3問チェック)

    迷ったら、上から順にチェックする。本当はもっと迷うべきなんですが、3問にしないと自分が動けないので3問にしました。


    1. 「直前の会話と同じテーマ?」
      YES → 続行。NO → 新規。
      翻訳の続きで翻訳を頼むなら続行、Excel の話を始めるなら新規。境目はけっこうハッキリしているので、迷ったら2問目へ。



    2. 「Claude が前提にしているファイル状態は、まだそのまま?」
      YES → 続行。NO → 新規。
      Excel の構造を大きく変えた、フォルダの中身を入れ替えた、などの後は新規にする。「さっきのファイル覚えてる?」と聞いた時点で、もう新規が正解だったりする。



    3. 「セッションが長くなりすぎて、自分でも何が話されたか追えない?」
      YES → 新規 or /compact で要約。NO → 続行。
      /compact は履歴を圧縮するスラッシュコマンド。完全リセットせずに重さだけ落とせる。要するに会話のダイエット機能です(例えが合っているかは別として)。



    同じ作業、続けるか・新規か

    例:朝、Excel に経費を整理してもらった。午後、別の作業として「ブログ記事の下書きを書いてほしい」と頼みたい。完全に午前と午後で別人格になりたい日です。

    そのまま続けるとどうなるか:

    午前のセッションで…
    私: Documents/領収書/202603/ の JPG を OCR して
    expenses.xlsx に追記して。
    Claude: 12枚処理しました。3枚は要確認です。
    午後、同じセッションで…
    私: ブログ記事の下書きを書いて。テーマはコンテキスト管理。
    Claude: かしこまりました。経費レポートを踏まえつつ、
    コンテキスト管理についての記事を…
    (← 関係ない経費を引っぱってきた)

    経費の話題が引きずられて、関係ない場所に出てくる。記事に「3枚は要確認です」とか出てきても困る。

    新規にすると:

    午後、新しいセッションで…
    私: ブログ記事の下書きを書いて。テーマはコンテキスト管理。
    Claude: 何文字くらいで考えていますか?想定読者は?
    (← まっさらな状態でヒアリングが始まる)

    「初対面の Claude さん、こんにちは」状態。これがいちばん仕事が早い。
    判断のクセが付くまでは「Claude が変な前提で答えてきた瞬間に、新規にし直す」を続けると、リズムをつかみやすい。最初は新規にし直しすぎて、逆に毎回ゼロから説明する事故も起きました。バランスです、何事も。


    つまずき

    ここからは、私が実際にやらかした話です。先輩の失敗談を聞くつもりで読んでください(先輩というには日が浅いですが)。

    • Code セッションで雑談を始めてしまう: Code セッションはリポジトリのコードを前提に話を聞く設計なので、関係ない雑談を続けると「このコードを直そうとしてる?」と勝手に解釈し始めることがある。雑談は Chat 側に逃がすのが安全です。Code セッションでお昼ごはんの相談をしてはいけない(やった)。
    • Cowork セッションを使い捨てにしてしまう: 1つで完結するつもりで始めたのに、後から続きが出てきて「あのセッション、どこだっけ」になりがち。これはまさにシュレーディンガーのセッション——開いてみるまで、どれが目当てのやつかわからない。終わったセッションは名前の頭に【完了】を付けておくと、続きを開きたいときに区別しやすい。
    • 「重いから新規」と「履歴がほしいから続行」が両立しないとき: 答えは /compact。会話を要約して短くしつつ、流れは保てる。完全に切るほどではない、というときの中間オプションとして覚えておくと便利。「離婚するほどじゃないけど、ちょっと距離を置きたい」みたいなときに使ってください(例えが重い)。

    まとめ

    私が新しく作るときの判断は、結局この3問。

    • 直前と同じテーマ? → 続行(違うなら新規)
    • Claude が前提にしてるファイル状態は今もそのまま? → 続行(変わったなら新規)
    • 重くなりすぎ? → /compact で軽量化、それでもダメなら新規

    Chat は気軽に新規、Cowork セッションは「テーマ単位」で新規、Code セッションは「リポジトリ単位」で新規。
    コンテキストは、引き継ぐと便利な資産にも、引きずると重荷にもなる。場所を変えてリセットするのは、Claude を混乱させないためというより、自分が混乱しないため、という気がしている。冒頭の段ボール状態に戻ると、結局困るのは荷物を詰めた本人なんですよね。


    関連リンク

  • AskUserQuestion ー Claudeが逆に私に質問してきた

    AskUserQuestion ー Claudeが逆に私に質問してきた

    あれ、これだったのか

    Claudeに何かお願いしようとしたとき、ふと返ってきたのが「質問の答え」じゃなくて「質問」だった。

    え、逆になってる。

    でも冷静に考えると、当たり前の話で。職場でも「これお願いします」と言われた側の人間は「えっと、どういう形式で?」「いつまでに?」って確認しますよね。……確認しないで進めて「こうじゃなかった」ってなること、ありますよね。私はあります(しかも結構な頻度で)。

    それをClaudeがやってくれているだけ。問い返してきた = ちゃんと考えてる、ということでした。Cowork(※ClaudeのデスクトップAI作業支援ツール)に AskUserQuestion(選択肢UI) という機能があって、これがその確認の仕組みです。


    結論マップ(ビフォー/アフター)

    改善前(Before)改善後(After)
    曖昧な依頼でも問答無用で進めてしまう実行前に選択肢UIで確認する
    意図とズレた成果物が出来上がるユーザーの意図を正確に把握してから動く
    「こうじゃなかった」と後から修正最初に合わせることで手戻りがなくなる

    要するに何ができるか

    AskUserQuestion(アスクユーザークエスチョン)は、Cowork モードで Claudeが作業の前に「確認したいことを選択肢付きで聞いてくる」 機能です。

    ふだん私たちがClaudeに質問するのとは逆——Claudeが私に質問してきます。しかもボタン形式の選択肢で。テキストで長々と説明するより、ボタンをクリックするだけで意図が伝わるので、体感すごく楽です。「説明するのがめんどくさい」って思う場面ほど助かる。

    たとえば「先月の出費をまとめて」と頼んだとします。確認なしで突っ走られると、「カテゴリが違う」「単位が違う」「これじゃなかった……」という状況が普通に起きます。AskUserQuestionが入ると、Claudeは先に「どんな形式にしますか?」「カテゴリはどう分けますか?」を選択肢で出してくれます。

    ソクラテスが弟子に答えを教えるのではなく問いを投げかけて自分で考えさせた、あの問答法にちょっと似ていますが、Claudeの場合は「あなたの意図を正確に受け取りたい」という実用的な理由なので、哲学の授業は始まりません。安心してください。


    とりあえずやってみる

    特別な設定は不要です。Coworkモードで以下のような依頼を投げると、自然に体験できます。

    1. Coworkを起動して、複数の工程が絡む依頼を送る(例:「Excelファイルを整理して報告書にまとめて」)
    2. Claudeが即座に動き始めるのではなく、選択肢のパネルが表示される——「え、動いてない?」となる瞬間ですが、動いてないんじゃなく聞いてます
    3. 選択肢のボタンをクリックするか、補足テキストを入力する(難しいことはなにもない)
    4. Claudeが意図を把握してから本作業を開始する——ここからが本番

    「複数ステップある依頼」「ファイルが複数ある依頼」「形式の選択肢がある依頼」は特に確認が入りやすいです。単純な質問や一問一答の会話では出てきません。なので、いきなり使おうとしても来ないこともある。「なんか来ない」は普通です。


    実際に打ったプロンプト

    以下の2つのファイルを見て、先月の支出を
    「食費」「光熱費」「その他」に分類してまとめてください。
    添付: shopping_april.txt / bills_april.txt

    💡 ポイント: 「分類」「まとめ」「形式」が絡む依頼ほど確認が入りやすい。実は曖昧な依頼の方がAskUserQuestionが活躍する。依頼が雑なほど助かる、という逆説的な機能。

    Claudeが返してきた選択肢の例(こんなイメージです):

    どの形式でまとめますか?
    [A] 表形式(カテゴリ別)
    [B] 箇条書きリスト
    [C] 合計金額だけ出す

    Aを選ぶとそのまま表形式で出力が始まります。「えっそれだけでいいの」という使い勝手のよさ。この「えっそれだけ」感、最初体験したときけっこう感動しました。


    やらかしたこと


    • 「止まってる!」と焦って同じ指示を再送した: AskUserQuestionが表示されたとき「なんで反応がないんだろう」と思い、同じ依頼をもう一度送ってしまいました。Claudeは答えを待っていただけ。二重投稿になって少し混乱させてしまいました(ごめんなさい)。まず選択肢UIを確認するのが正解です。



    • 「なんでもいいよ」で返した: 「お任せして」と返したらClaudeは「お任せ」の中でそれなりの判断をしてくれました。出来上がったものはそれなりで、「あ、でもこっちがよかった」とは思いました。後悔はない。でも選択肢があるときはちゃんと選んだ方がいいです(当たり前のことを学んだ)。



    • 質問への返答より先に別の話をした: 「あ、でもそのファイルなんですけど、もう一個あって——」みたいな感じで別の補足を先に送ってしまい、会話がちょっとこんがらがりました。まずClaudeの質問に答えてから補足する順番が大事でした。割り込みはよくない(どこでも)。



    で、結局どうなの

    正直に言うと、最初は「いちいち確認しなくていいのに」と思っていました。早く始めてほしい、という気持ち。

    でも何度か「完成したけど形式が違う……」をやらかしてから、気持ちが変わりました。確認される一瞬を惜しんで、あとで1時間かけて修正する方がよっぽど時間の無駄です。1時間、返ってきません。

    AskUserQuestionは「Claudeが仕事をさぼっている」のではなく「正確にやろうとしている」から出てくる確認です。最初に意図を合わせるほど、最後に「こうじゃなかった」がなくなる。

    こういうことは最初から教えてほしかった。でも自分で気づく方が記憶に残るので、まあ、よかったです(そういうことにしておく)。


    関連リンク

  • Computer Use ── 「え、PC操作まで代わりにやってくれるの」試してみた

    Computer Use ── 「え、PC操作まで代わりにやってくれるの」試してみた


    先に言っておく

    Claudeに「今の画面を見て、そのボタンをクリックしておいて」と頼めるとは、去年の私には想像もできなかった。正直、思い上がりにもほどがある機能だと思っていた(失礼なことを言っている自覚はある)。

    でも、できる。しかも今のCoworkなら、普通の会話の延長でそれが実現してしまう。すごい話をしてますよ、これ。

    「え、これって最初からできたの?」と思うかもしれない。私もそう思った。実は、Windowsで使えるようになったのは2026年4月のことで、ほんとうに最近の話だ——つまり去年の私が知らなかったのは全く正当な理由があった。正当化したかっただけとも言う。


    結論マップ(ビフォー/アフター)

    現状(Before)改善後(After)
    状況を言葉で説明しなければならないClaudeが画面を見て状況を把握できる
    全操作を自分でこなすクリック・入力をClaudeに任せられる場面が増える
    「ここをクリックして」が伝わるか不安Claudeが座標を判断して直接操作できる

    これが本体——要するにどういうこと?

    「Computer Use」とは、ClaudeがPCの画面を見て、マウス操作・キーボード入力・スクリーンショット撮影などを代わりにやってくれる機能のことだ。

    「……え、それって人間がやることじゃないの?」という感想、わかります。私も全く同じこと思いました。

    CoworkでClaudeに「スクリーンショットを撮って」とお願いすると、内部的には mcp__computer-use__screenshot(=画面を撮影する仕組み)が動いて、今まさに映っている画面をキャプチャする。さらに、クリック(mcp__computer-use__left_click)や文字入力(mcp__computer-use__type)も使えば、Claudeが実際に画面上を操作することができる。なんか怖いですね(言いたかっただけです、ごめんなさい)。

    平たく言うと、「Claudeが画面を見て→どこを押すか判断して→代わりに押す」という流れだ。説明するのに1段落かかったのに、やってることを一言でまとめると「かわりにクリックする」だけなのが若干脱力する(でもすごい)。

    ただし、アプリの種類によって「触り方」に制限がある:

    • ブラウザ(Chrome, Edge など):画面を見ることはできるが、クリック・入力はできない(のぞき見だけOKな感じ)
    • ターミナルやVSCode:クリックはできるが、文字を打ち込むことはできない(半人前みたいな権限)
    • その他のアプリ(メモ帳など):制限なし、フルコントロール(やりたい放題)

    こうやって動かした——手順が思ったより少なくて拍子抜けした

    実際にCoworkでComputer Useを試す手順はこうだった:

    1. Coworkを開いて、Claudeに「スクリーンショットを撮って」と伝える
    2. Claudeが「このアプリにアクセスしていいですか?」と確認してくる(礼儀正しい)
    3. 「許可」を押すと、Claudeが画面をキャプチャして状況を把握してくれる
    4. 続けて「〇〇のボタンをクリックして」などと指示する

    これだけ。「え、設定とかインストールとか特になしで?」と私も思ったが、ほんとにこれだけだった。拍子抜け、というのが正直なところだ。

    ちなみにClaudeは「まずMCPや拡張機能が使えないか確認してから、Computer Useに移行する」という順番を守っている。偉い。SlackやGmailはMCPが使えるのでそちら優先、ウェブはChrome拡張経由、それ以外のデスクトップアプリだけComputer Useを出動、という段階制だ。「なんでもかんでも画面を覗いてるわけじゃない」のは、言われてみれば安心できる仕様で、ちゃんと考えられているなと思った(偉い、2回目)。


    試してみたプロンプト——こう書いたら動いた

    今開いているウィンドウのスクリーンショットを撮って、
    画面に何が表示されているか説明してください。

    💡 ポイント: 「今開いているウィンドウ」と具体的に指定すると、Claudeが迷わず目的の画面を確認しに行ってくれる。「開いてるやつ」では通じなかった(1回やらかした)。

    もう少し踏み込んだ例:

    メモ帳アプリを開いて、「今日のタスクリスト」というタイトルで
    新しいファイルを作成してください。

    これを試すと、Claudeがアプリへのアクセスを一つひとつ確認しながら進めてくれる。許可ボタンを押した瞬間に「あ、本当に動いてる……」という感覚があって、思わず声が出た。隣に誰かいたらちょっと恥ずかしかったと思う。

    「完全に理解しました」と言いたいところだが、正直まだ「すごい」という感想の方が大きい。動いたのでヨシ! とだけ言っておく。


    引っかかりやすいポイント——最初でつまずいた3つ


    • アプリごとに毎回許可が必要:Claudeが「このアプリにアクセスしていいですか?」と確認してくる。確認するまで使えるかどうかわからない——シュレーディンガーのアクセス権限、とでも言えばいいか。セキュリティ上の設計なので理屈はわかるのだが、最初の数回は「またか…」とはなる(すぐ慣れます)。



    • ブラウザ操作は別の仕組みが必要:ChromeやEdgeは画面の確認はできるが、クリックや入力はできない。「じゃあブラウザで代わりに操作してよ!」という気持ちになるのは当然だが、そのためには「Claude in Chrome」という別の拡張機能が必要になる。世の中そんなに甘くない(次の記事の伏線として置いておく)。



    • センシティブなアプリでは使わない方がいい:AnthropicもResearch Preview(試験運用中)と明記している機能なので、銀行アプリや個人情報を扱うサービスでの使用は現時点では推奨されていない。「なんでも任せよう!」という気持ちはいったん保留で。



    これが言いたかった

    冒頭で「去年の私には想像もできなかった話だ」と書いたが、Windowsへの対応が始まったのは本当についこの前(2026年4月)のことだ。だから去年の私が知らなかったのは正当な理由がある。2回目の正当化ですが、今度こそ本当です。

    まだResearch Previewなので完璧ではない。操作が遅いこともあるし、センシティブなアプリでは使えない制限もある。でも「自分でやらなくていい」という選択肢が増えた感覚は、思ったより大きかった。正直、「知らなかった3年間を返してほしい」くらいの気持ちになりかけた(Windows対応が始まったのは先月なので、3年はさすがに言いすぎた)。

    最初に「できるとは思っていなかった」と書いたのに、今は「次は何を任せられるんだろう」と前のめりになっている自分がいる。

    これ、困るやつですよね(期待の方向で、ですが)。


    関連リンク