進捗 使い方 スペック オープンソース EN GitHub

群衆を楽器にする。

1台は記憶。100台はオーケストラ。
フェスの観客全員がハミングすると、AIがリアルタイムでハーモニーを生成する。
5グラムの小石が、人と音の関係を変える。

~0g
目標重量
~0h
バッテリー (推定)
Open
ハードウェア
プロジェクト進捗を見る 目標スペック

プロジェクト進捗

Koeは開発中のオープンソースプロジェクトです

ハードウェア
回路設計完了、部品を発注中
70%
ファームウェア
開発中 (ESP32-S3 + Rust)
40%
ソフトウェア
Koe音声入力アプリ macOS/Windows版 公開中 — app.koe.live
100%
プロトタイプ
初号機を設計中
20%
ONLY KOE CAN DO THIS

スマホにできないことを、やる。

他のAIウェアラブルは「小さくしたスマホ」。Koeは人が集まるほど強くなるデバイス。これを可能にしているのがSolunaプロトコル — GPS原子時計同期、音速補正、分散メッシュをゼロインフラで実現するオープン規格。

01

Crowd Orchestra 群衆オーケストラ

フェスの観客1000人がハミングする。各デバイスがピッチを検出。AIがリアルタイムでハーモニーを計算し、足りないパートを全デバイスから補完再生する。楽器を弾けなくても、全員で音楽が作れる。

4つの楽器波形が同期してハーモニーに合流

デバイス上でピッチ検出(ESP32 DSP) → UDPでピッチデータ共有(音声の1/100の帯域) → STAGEでハーモニー計算 → GPS同期で全デバイス同時再生

02

Sound Memory 音の記憶

「さっき誰かが言ってた店の名前なんだっけ?」→ その瞬間の音声が再生される。テキストへの変換ではない。声のトーン、背景音、感情 — テキストでは失われる情報を保持する。

常時録音(30秒ローカルバッファ + クラウド圧縮保存) → セマンティック音声検索 → ダブルタップでオーディオブックマーク → AIデイリーダイジェスト(1日を2分に要約)

03

Spatial Crowd 空間群衆

フェス会場の1000台のマイクが、リアルタイムで3D音声マップを作る。アーティストは群衆のどこで最も盛り上がっているかを音で知る。録音すれば「あのフェスの体験」を後から3Dで再生できる。

SUB/FILLのGPS座標 + 全デバイスのマイク入力 → STAGEで3Dオーディオマップ合成 → 空間音響レンダリング → ヘッドホンで360度再生

ギターからiPhone経由で複数Koeデバイスに30ms配信
30ms ULTRA LOW LATENCY

ギターを弾く。
部屋中のKoeが鳴る。

iPhoneにシールドを挿す。WiFi経由で周りのKoeデバイスに30msで音が届く。リハーサルスタジオが不要になる。リビングがステージになる。

シグナルフロー: ギター→iPhone→WiFi→Koe群
Koe 5モデルラインナップ

Pick · Ear Cuff · Coin · Band · Lantern

AI生成イメージ — プロトタイプ開発中

Ear Cuffを装着
つける

耳の後ろに。つけていることを忘れる。

25 x 30mm、たった5グラム。AirTagより小さい。クリップで留めても、ピンで付けても、チェーンで下げても。あなたの声と周りの音をすべて記録する。ボタンを押す必要なし。画面を見る必要なし。

マイク: INMP441 MEMS、SNR 61dB、I2Sデジタル出力
音声検出: デバイス上でVAD処理、発話時のみクラウドに送信
Coin型デバイスを指で持つ
持つ

川で拾った滑らかな小石のような手触り。

マットなセラミック質感の仕上げ。指の間に自然と収まる丸みを帯びたエッジ。静かに呼吸するLEDが1つ。ロゴなし。ラベルなし。ジュエリーのような静かなテクノロジー。

筐体: PC/ABS マット + セラミックコーティング
LED: RGB 1個、7状態、呼吸するアニメーション
ボタン: 側面の埋め込みボタン(ミュート/手動トリガー)
Band v2をフェスで手首に装着
聴く

AIが話しかけてくるとき、いい音で聴きたい。

Koe STUDIOは28mmフルレンジドライバーを搭載。デスクに置いて会議で使う。カバンにクリップして屋外の会話に使う。クレジットカードサイズの筐体から、想像以上の音が出る。

ドライバー: 28mm フルレンジ、4ohm、3W (目標)
音圧: ~85dB @ 1m (推定)、DSPエコーキャンセル搭載
バッテリー: 2000mAh目標、~24時間録音 (推定)
Lantern STAGEをフェスのステージに設置
Solunaモード

1台に話す。全員に届く。

ボタンを中押しでKoeモード(AIアシスタント)からSolunaモード(P2P音声メッシュ)に切替。フェスティバル、カンファレンス、あらゆるイベントで、同じWiFiに繋がった複数のKoeデバイスが即座に音声チャンネルを形成。サーバー不要。アプリ不要。設定不要。ただ話すだけ。

他のAIウェアラブルにはできないこと。Humane Pin、Rabbit R1、Friend — どれもデバイス同士で会話できない。Koeはできる。

Soluna: solun.art
プロトコル: UDPマルチキャスト 239.42.42.1:4242 — インフラ不要
デバイス発見: mDNSによるローカルWiFi自動発見
LED: ピア同期中はオレンジのパルス
遅延: ローカルネットワーク上で50ms未満
切替: ボタン中押しでKoe / Solunaモード切替
Soluna Edition (フェス用超高音質モデル) →
AV SYNC

映像も、照明も、同じ時計で。

GPSで音声を同期しているなら、映像もLEDも同じ精度で同期できる。

🎬

ステージ映像

Pi 5のHDMI → LED壁。音声と同じGStreamerパイプラインだから映像とのずれゼロ

追加コスト: ケーブル代のみ

💡

群衆LEDショー

全CROWDのWS2812B LEDがGPS同期で完璧に同時に光る。1000人のLEDが波打つ。Coldplayと同じ演出。

追加コスト: $0 (LED既搭載)

📱

スマホ連携

WebSocketで制御データを配信。歌詞表示、ビート同期フラッシュ、波形ビジュアライザをブラウザで。

映像は送らない。制御だけ

COLDPLAY PIXMOB

専用リストバンド $5-10/人
音響は別系統
専門チームで設営

KOE SOLUNA

LED+音 同一デバイス $0追加
GPS原子時計同期
電源入れるだけ

音速 vs 電波速度の可視化

音速(黄) vs 電波(赤) — 電波は87万倍速い。だからCROWDは音より先に届く。

Koeの頭の中。

クラウドで5つのAIエージェントが協調して動く。デバイスは耳と口。

1
常に聴いている、でもアップロードしない
デバイス上に30秒のリングバッファ。音声活動検出(VAD)はローカルで実行。実際の発話だけがクラウドに送信される。
2
文字起こしして、文脈を理解
クラウドで音声→テキスト変換。過去の会話の文脈が引き出される。3時間前に話していたことも、AIは覚えている。
3
考えて、調べて、答える
推論、Web検索、記憶の各エージェントが協力して回答を作る。チャットボットの返答ではなく、あなたの好みを知っている上での回答。
4
イヤホンで、または内蔵スピーカーで返答
TTS音声がストリーミングで返ってくる。MINIはBLEイヤホンから。STUDIOは内蔵28mmドライバーから。WiFiでサブ秒のレイテンシ。

管理ダッシュボード

イベント全体をリアルタイムで監視・制御。デバイスの同期状態、バッテリー、音量をブラウザから一括管理。

イベント全体をリアルタイムで監視・制御。
デバイスの同期状態、バッテリー、音量をブラウザから一括管理。

ダッシュボードを試す →

すべてのスペック。

3モデル。同じAIの頭脳。あなたの生活に合う形を選ぶ。

すべて目標スペックです — プロトタイプ開発中に変更の可能性あり
MINI BAND STUDIO
サイズ25 x 30 x 9mm42 x 18 x 11mm50 x 70 x 20mm
重量~5g~25g~65g
装着ペンダント/クリップ/ピンリストバンドクリップ/スタンド
MCUESP32-S3 デュアルコア 240MHz、8MB Flash、2MB PSRAM
無線WiFi 802.11 b/g/n + Bluetooth LE 5.0
マイク1x MEMS モノラル2x MEMS ステレオ2x MEMS ワイド (40mm間隔)
マイク SNR61dB (INMP441、I2Sデジタル出力)
スピーカー-- (BLE出力)10 x 8mm28mm フルレンジ
周波数帯域--300Hz - 8kHzTBD (実測待ち)
最大音圧--~70dB~85dB @ 1m (推定)
DSPVADのみVADVAD + AEC + EQ
バッテリー200mAh120mAh2000mAh
録音時間~9h (推定)~5h (推定)~24h (推定)
ストリーミング~3h (推定)~2h (推定)~6h (推定)
充電USB-Cマグネット式USB-C
充電時間~30分~20分~90分
LED1x RGB5x RGBストリップ5x RGBストリップ
入力サイドボタン静電タッチボタン
防水TBDTBDTBD
カラーオブシディアン/セラミックホワイトブラック/ホワイト/グリーンオブシディアン
価格 (目標) TBD TBD TBD

すべてオープン。

Koeはオープンソースハードウェア。回路図をダウンロード、ケースを3Dプリント、自分でファームウェアを書き込める。はんだ付けしたくない人のためにデバイスも販売予定。

~$12
推定 BOM原価
27
部品点数
2層
基板
Rust
ファームウェア
5
フォームファクター
KiCad
回路設計
GitHubリポジトリ KiCadファイル 部品表
FAQ

よくある質問

これは何ですか?+

Koeは、常に周りの音を聞いていて、あなたが必要なときに情報を引き出せる超小型AIデバイスです。1台ではAIアシスタントとして使え、複数台集まるとデバイス同士が音声で繋がり、フェスティバルの群衆全体を1つの楽器に変えます。

いつ買えますか?+

現在プロトタイプを開発中です。ハードウェアはオープンソースなので、回路図とBOMをダウンロードして自分で作ることもできます。完成品の販売時期は未定です。GitHubリポジトリをスターしておくと、進捗をフォローできます。

常に録音していて大丈夫?プライバシーは?+

Koeはデバイス上で音声活動検出(VAD)を行い、あなたが話したときだけクラウドに送信します。待機中の音声はデバイス上の30秒リングバッファに留まり、外部には送信されません。ファームウェアはオープンソースなので、何が送信されているか誰でも検証できます。

Solunaモードって何?+

同じWiFiネットワーク上にある複数のKoeデバイスが、自動でP2P音声メッシュを形成するモードです。1台に話しかけると、全員のデバイスから同期された音が出ます。フェスティバルでは、ステージのSTAGEユニットから観客のCROWDデバイスに音を配信し、GPS原子時計で完璧に同期します。サーバー不要、アプリ不要。

他のAIウェアラブル(Humane Pin, Rabbit R1等)と何が違う?+

他のAIウェアラブルは「小さくしたスマホ」です。1台で完結し、人が増えても何も変わりません。Koeは人が集まるほど強くなるデバイスです。100台のKoeが同期して鳴ると、群衆全体がオーケストラになります。デバイス間通信ができるのはKoeだけです。さらにオープンハードウェアなので、誰でも改造・拡張できます。

自分で作れますか?+

はい。KiCad回路図、BOM(部品表)、ファームウェア(Rust)、3Dプリント用ケースデータ、全てオープンソースです。ESP32-S3開発ボード + INMP441マイク + MAX98357Aアンプをブレッドボードに挿すだけでプロトタイプが作れます。部品代は約¥5,700です。→ 部品リスト

TEAM

作っている人

Y
Yuki Hamada
EnablerDAO / Tokyo
Elio (P2P AI), Soluna (フェス音響), chatweb.ai を開発。
Koeはこれらを繋ぐデバイス — AIの耳と口。
GitHub Web

一緒に作りませんか。

Koeはオープンソースプロジェクトです。ハードウェア設計、ファームウェア、音響、デザイン — あらゆる貢献を歓迎します。