ONLY KOE CAN DO THIS

スマホにできないことを、やる。

他のAIウェアラブルは「小さくしたスマホ」。Koeは人が集まるほど強くなるデバイス。これを可能にしているのがSolunaプロトコル — GPS原子時計同期、音速補正、分散メッシュをゼロインフラで実現するオープン規格。

Crowd Orchestra 群衆オーケストラ

フェスの観客1000人がハミングする。各デバイスがピッチを検出。AIがリアルタイムでハーモニーを計算し、足りないパートを全デバイスから補完再生する。楽器を弾けなくても、全員で音楽が作れる。

デバイス上でピッチ検出(ESP32 DSP) → UDPでピッチデータ共有(音声の1/100の帯域) → STAGEでハーモニー計算 → GPS同期で全デバイス同時再生

Sound Memory 音の記憶

「さっき誰かが言ってた店の名前なんだっけ？」→ その瞬間の音声が再生される。テキストへの変換ではない。声のトーン、背景音、感情 — テキストでは失われる情報を保持する。

常時録音(30秒ローカルバッファ + クラウド圧縮保存) → セマンティック音声検索 → ダブルタップでオーディオブックマーク → AIデイリーダイジェスト(1日を2分に要約)

Spatial Crowd 空間群衆

フェス会場の1000台のマイクが、リアルタイムで3D音声マップを作る。アーティストは群衆のどこで最も盛り上がっているかを音で知る。録音すれば「あのフェスの体験」を後から3Dで再生できる。

SUB/FILLのGPS座標 + 全デバイスのマイク入力 → STAGEで3Dオーディオマップ合成 → 空間音響レンダリング → ヘッドホンで360度再生

AI生成イメージ — プロトタイプ開発中

つける

耳の後ろに。つけていることを忘れる。

25 x 30mm、たった5グラム。AirTagより小さい。クリップで留めても、ピンで付けても、チェーンで下げても。あなたの声と周りの音をすべて記録する。ボタンを押す必要なし。画面を見る必要なし。

マイク: INMP441 MEMS、SNR 61dB、I2Sデジタル出力
音声検出: デバイス上でVAD処理、発話時のみクラウドに送信

持つ

川で拾った滑らかな小石のような手触り。

マットなセラミック質感の仕上げ。指の間に自然と収まる丸みを帯びたエッジ。静かに呼吸するLEDが1つ。ロゴなし。ラベルなし。ジュエリーのような静かなテクノロジー。

筐体: PC/ABS マット + セラミックコーティング
LED: RGB 1個、7状態、呼吸するアニメーション
ボタン: 側面の埋め込みボタン（ミュート/手動トリガー）

聴く

AIが話しかけてくるとき、いい音で聴きたい。

Koe STUDIOは28mmフルレンジドライバーを搭載。デスクに置いて会議で使う。カバンにクリップして屋外の会話に使う。クレジットカードサイズの筐体から、想像以上の音が出る。

ドライバー: 28mm フルレンジ、4ohm、3W (目標)
音圧: ~85dB @ 1m (推定)、DSPエコーキャンセル搭載
バッテリー: 2000mAh目標、~24時間録音 (推定)

Solunaモード

1台に話す。全員に届く。

ボタンを中押しでKoeモード（AIアシスタント）からSolunaモード（P2P音声メッシュ）に切替。フェスティバル、カンファレンス、あらゆるイベントで、同じWiFiに繋がった複数のKoeデバイスが即座に音声チャンネルを形成。サーバー不要。アプリ不要。設定不要。ただ話すだけ。

他のAIウェアラブルにはできないこと。Humane Pin、Rabbit R1、Friend — どれもデバイス同士で会話できない。Koeはできる。

Soluna: solun.art
プロトコル: UDPマルチキャスト 239.42.42.1:4242 — インフラ不要
デバイス発見: mDNSによるローカルWiFi自動発見
LED: ピア同期中はオレンジのパルス
遅延: ローカルネットワーク上で50ms未満
切替: ボタン中押しでKoe / Solunaモード切替

Soluna Edition (フェス用超高音質モデル) →

AV SYNC

映像も、照明も、同じ時計で。

GPSで音声を同期しているなら、映像もLEDも同じ精度で同期できる。

🎬

ステージ映像

Pi 5のHDMI → LED壁。音声と同じGStreamerパイプラインだから映像とのずれゼロ。

追加コスト: ケーブル代のみ

💡

群衆LEDショー

全CROWDのWS2812B LEDがGPS同期で完璧に同時に光る。1000人のLEDが波打つ。Coldplayと同じ演出。

追加コスト: $0 (LED既搭載)

📱

スマホ連携

WebSocketで制御データを配信。歌詞表示、ビート同期フラッシュ、波形ビジュアライザをブラウザで。

映像は送らない。制御だけ

COLDPLAY PIXMOB

専用リストバンド $5-10/人
音響は別系統
専門チームで設営

KOE SOLUNA

LED+音同一デバイス $0追加
GPS原子時計同期
電源入れるだけ

Koeの頭の中。

クラウドで5つのAIエージェントが協調して動く。デバイスは耳と口。

常に聴いている、でもアップロードしない

デバイス上に30秒のリングバッファ。音声活動検出(VAD)はローカルで実行。実際の発話だけがクラウドに送信される。

文字起こしして、文脈を理解

クラウドで音声→テキスト変換。過去の会話の文脈が引き出される。3時間前に話していたことも、AIは覚えている。

考えて、調べて、答える

推論、Web検索、記憶の各エージェントが協力して回答を作る。チャットボットの返答ではなく、あなたの好みを知っている上での回答。

イヤホンで、または内蔵スピーカーで返答

TTS音声がストリーミングで返ってくる。MINIはBLEイヤホンから。STUDIOは内蔵28mmドライバーから。WiFiでサブ秒のレイテンシ。

すべてのスペック。

3モデル。同じAIの頭脳。あなたの生活に合う形を選ぶ。

すべて目標スペックです — プロトタイプ開発中に変更の可能性あり

	MINI	BAND	STUDIO
サイズ	25 x 30 x 9mm	42 x 18 x 11mm	50 x 70 x 20mm
重量	~5g	~25g	~65g
装着	ペンダント/クリップ/ピン	リストバンド	クリップ/スタンド

MCU	ESP32-S3 デュアルコア 240MHz、8MB Flash、2MB PSRAM
無線	WiFi 802.11 b/g/n + Bluetooth LE 5.0

マイク	1x MEMS モノラル	2x MEMS ステレオ	2x MEMS ワイド (40mm間隔)
マイク SNR	61dB (INMP441、I2Sデジタル出力)
スピーカー	-- (BLE出力)	10 x 8mm	28mm フルレンジ
周波数帯域	--	300Hz - 8kHz	TBD (実測待ち)
最大音圧	--	~70dB	~85dB @ 1m (推定)
DSP	VADのみ	VAD	VAD + AEC + EQ

バッテリー	200mAh	120mAh	2000mAh
録音時間	~9h (推定)	~5h (推定)	~24h (推定)
ストリーミング	~3h (推定)	~2h (推定)	~6h (推定)
充電	USB-C	マグネット式	USB-C
充電時間	~30分	~20分	~90分

LED	1x RGB	5x RGBストリップ	5x RGBストリップ
入力	サイドボタン	静電タッチ	ボタン
防水	TBD	TBD	TBD
カラー	オブシディアン/セラミックホワイト	ブラック/ホワイト/グリーン	オブシディアン
価格 (目標)	TBD	TBD	TBD

FAQ

よくある質問

これは何ですか？+

Koeは、常に周りの音を聞いていて、あなたが必要なときに情報を引き出せる超小型AIデバイスです。1台ではAIアシスタントとして使え、複数台集まるとデバイス同士が音声で繋がり、フェスティバルの群衆全体を1つの楽器に変えます。

いつ買えますか？+

現在プロトタイプを開発中です。ハードウェアはオープンソースなので、回路図とBOMをダウンロードして自分で作ることもできます。完成品の販売時期は未定です。GitHubリポジトリをスターしておくと、進捗をフォローできます。

常に録音していて大丈夫？プライバシーは？+

Koeはデバイス上で音声活動検出(VAD)を行い、あなたが話したときだけクラウドに送信します。待機中の音声はデバイス上の30秒リングバッファに留まり、外部には送信されません。ファームウェアはオープンソースなので、何が送信されているか誰でも検証できます。

Solunaモードって何？+

同じWiFiネットワーク上にある複数のKoeデバイスが、自動でP2P音声メッシュを形成するモードです。1台に話しかけると、全員のデバイスから同期された音が出ます。フェスティバルでは、ステージのSTAGEユニットから観客のCROWDデバイスに音を配信し、GPS原子時計で完璧に同期します。サーバー不要、アプリ不要。

他のAIウェアラブル(Humane Pin, Rabbit R1等)と何が違う？+

他のAIウェアラブルは「小さくしたスマホ」です。1台で完結し、人が増えても何も変わりません。Koeは人が集まるほど強くなるデバイスです。100台のKoeが同期して鳴ると、群衆全体がオーケストラになります。デバイス間通信ができるのはKoeだけです。さらにオープンハードウェアなので、誰でも改造・拡張できます。

自分で作れますか？+

はい。KiCad回路図、BOM(部品表)、ファームウェア(Rust)、3Dプリント用ケースデータ、全てオープンソースです。ESP32-S3開発ボード + INMP441マイク + MAX98357Aアンプをブレッドボードに挿すだけでプロトタイプが作れます。部品代は約¥5,700です。→ 部品リスト

群衆を楽器にする。

プロジェクト進捗

スマホにできないことを、やる。

Crowd Orchestra 群衆オーケストラ

Sound Memory 音の記憶

Spatial Crowd 空間群衆

ギターを弾く。
部屋中のKoeが鳴る。

耳の後ろに。つけていることを忘れる。

川で拾った滑らかな小石のような手触り。

AIが話しかけてくるとき、いい音で聴きたい。

1台に話す。全員に届く。

映像も、照明も、同じ時計で。

ステージ映像

群衆LEDショー

スマホ連携

Koeの頭の中。

管理ダッシュボード

すべてのスペック。

すべてオープン。

よくある質問

作っている人

一緒に作りませんか。

群衆を楽器にする。

プロジェクト進捗

スマホにできないことを、やる。

Crowd Orchestra 群衆オーケストラ

Sound Memory 音の記憶

Spatial Crowd 空間群衆

ギターを弾く。部屋中のKoeが鳴る。

耳の後ろに。つけていることを忘れる。

川で拾った滑らかな小石のような手触り。

AIが話しかけてくるとき、いい音で聴きたい。

1台に話す。全員に届く。

映像も、照明も、同じ時計で。

ステージ映像

群衆LEDショー

スマホ連携

Koeの頭の中。

管理ダッシュボード

すべてのスペック。

すべてオープン。

よくある質問

作っている人

一緒に作りませんか。

ギターを弾く。
部屋中のKoeが鳴る。