各要素について学習用のニューラルネットワークをだいたい完成させる。
・データセット集め
・声の年齢分析の学習を完成させる
・データセット集め
・印象と感情それぞれを分析するニューラルネットワークを作る
・出来るだけデータセットを増やして精度向上のトライ&エラー
・データが少なくてもニューラルネットワークの構造からのアプローチで精度を上げる
①ふだん喋る感じで「ボイシー、私の声を聴いて。」という声
②【joy喜び・anger怒り・sad悲しみ・fun楽しみ・question疑問・surprise驚き】
の6要素をそれぞれ込めた声で「誰かに呼びかけるセリフ(5秒間)」を6要素分(6パターン)
※↑②をセリフとしていますが、色んな言葉のサンプルをとりたいため内容をお任せしているだけで、別に芝居っぽくする必要は無いです。自然体で大丈夫です。
の声データを集めています。
詳細
①には「sample」というファイル名
②には「joy」などのように(上記の通りに各感情の英単語)というファイル名
それぞれ規定に従ったファイル名で、ファイル形式はwavファイルの形式で私のSlackのDMもしくはLINEに音声を送ってください。
※収集した音声は、私のプロジェクトに使うAIの学習以外には利用致しません。
ご家族やご友人、おじいちゃんおばあちゃんなど身の回りの方にも、幅広くお声かけ頂けると大変助かります。
是非是非ご協力よろしくお願いします。
(質問などあればお気軽にどうぞ)