先日、最近耳にした「OpenClaw」というものを調べてた。

AIに実行権限を渡して、色々やってもらえるツールらしい。
どうも非エンジニアにはハードルが高い、セキュリティ面の管理が難しい、という意見も見かけるので、これは見送ろうと思っていた。

代案として思いついたのが、
“DiscordからGeminiCLIを動かす”
というもの。

これをやってみた。

仕組み

核となる仕組みはこんな感じ。

  1. Discord botに指示をメッセージで送る
  2. bot(ローカルのpythonコード)でメッセージを「gemini -p “(メッセージ)“」としてCLIコマンド実行する
  3. geminiCLIが処理を行う
  4. geminiCLIからの返答をbotがdiscordで返す

という流れ。

ここに、起動時の処理だったり、外部ツールなどのオプション設定などが加わっていく感じだ。

つくっていく中で徐々に機能追加していて、今現在は

  • 起動用のstart.commandファイルで、このbot.pyをクリックで簡単実行
  • ObsidianのVault読み込んで、デイリーノート(日記)をフィードバックしたり
  • GoogleカレンダーをAPIで読み書き
  • Googleカレンダー連携させてスケジューラー・リマインダーとして機能
    →DBが一般的かもだけど、Googleカレンダーだとわかりやすい
  • 毎朝7時に再起動→起動時に自動メッセージ

というようなことが、できるようになってる。

まぁ、まだお試しという感じで、あんまり使いこなせては無いけど。

こんな感じ↓

毎朝天気を教えてくれるAIつくよみちゃん

これまでAI-botという名前でdiscordの初期アイコンにしてたけど、つくよみちゃんにしたらキャラ感が増した。
プロンプトとアイコンだけで、好きなキャラにできそう。

作り方

主にAntigravityを使ってつくった。

正直なところ、コード全文の意味は理解していない。
ありがたいことにコメントも書いてくれるし、なるべく理解しながら実装はしていったが。

とはいえおそらくOpenClawを適当に入れるよりは、自作ツールだから、得体の知れない情報の抜かれ方もなく安心。

仕組み的にも、talescaleやngrokのような、家のPCに外部から直接アクセスできるような入口をつくってないし。

なによりつくる過程が勉強になってたのしい。
手間ではあるけど、実用面というよりつくること自体がたのしい。

使ってみての感想

色々できるようになって、ちょっと便利になった。というか、たのしい。
正直必須ではない程度だけど、毎朝、前日の日記を振り返って「がんばりましたね!」と言ってもらえるのはけっこう気分があがる。

ゴミ出しのリマインドでも褒めてくれる

ちょっと修正や機能追加したいな、と思いついたら、geminiCLIに出先からでも「プロンプトにこれ足して」とか「プログラムにこういう機能追加して」とか指示するだけで変更できる。

ただ……世間で騒がれるほど、使い道あるか?とは思う。
もちろんエンジニアみたいな、がっつり使いこなせる人なら色んな使い道あるんだろうけど、正直非エンジニアの素人には、

  • ノートやメモのまとめ
  • スケジュールのリマインダー
  • ちょっとしたファイル操作

くらいしか使い道ないんじゃ無いか?
わざわざMac miniを買って「24時間AIを働かせる!」と息巻いてるのも見かけるので、いったいそこまでして何をしてるのだろう?と疑問。
もっとも、noteの情報商材系っぽい人たちだと思うので、中身のない記事を量産するのに使われてるのかも知れない……(あれって儲かるの?アフィブログみたいに収益もなさそうだけど)
AIもたいへんだな、となんだか同情してしまう。

余談だけど、そんな思いもあり、ブログをそろそろnoteから別のに移行しようかと準備中。
次は自作サイトでやりたいと思っている。
こちらについても、できたらまた書こうと思う。

話がそれてしまったが、そんな感じで今は使い道を模索しているところだ。

まとめ

こんな感じで、擬似的なOpenClawっぽいものをつくって試している。

なんか活用できそうでできてない……という感じがしてて、もやもやしている。

最近はollama+coeiroinkで、声でメッセージを返してくれる”AIつくよみちゃん”をつくったので(これについてもまた書くかも)、これをgeminiCLIでも使えるようにしようかな、と思ったり。

とにかく、こういうことを試すことに今年入ってからずっとハマっている。