波動と機械学習

人間の声を色相の変化を利用して3次元プロットした図に美しさを感じて、そのまま音声解析の道を進んでいます。自分なりに調べて実装できたものから更新していきます。アドバイス、アイデアなどあれば是非お願いします。

2020-01-01から1年間の記事一覧

話者認識

話者認識とは? 話者認識とは、マイクになどによって録音された音声から個人を認識・特定するコンピュータ処理のことです。 ここで言う「音声」とは人の声のこと指します。つまり、顔の見えない相手の声が、誰の声なのかコンピュータに推測させる分野のこと…

色々な波形を作ってみる(矩形波、三角波、鋸波)

このブログの記事は以下のサイトに移転しました。 より詳細な記事やプログラムの実装方法などは移設先のHPを参照ください。 teckonestep.com この記事では様々な形の周期波形を作成してみます。 作成した波形はそれぞれ特徴的な音色をしており、その違いが楽…

音声の再生と録音

本記事ではマイクから音声を録音、スピーカで再生する方法を記載します。 Pyaudioというモジュールを使用して実装していきます。 音声の再生 音声の録音 音声の再生 音声の録音・再生をする際はPyaudioで継続的にデータを入力or出力をしていきます。 コード…

音声データ(waveファイル)の基礎知識

ここでは音声データを扱う上で知っておくべき用語や知識を整理します。 基本的な用語 パラメータに関する用語 wavデータの構造について 基本的な用語 音源 解析・処理対象となるデータを指す。基本的には全てバイナリデータである。 静的な音源 ファイルに保…

音声データを操作してみる(ファイルの読み込み/書き込み)

この記事では音声データを自在に操れるようになることを目標に以下のことを学びます。 基本的に使用するプログラミング言語はPythonです。必要に応じて外部ツールや多言語にも触れていきます。音声データの基礎知識で学んだことを生かして学習を進めます。wa…

音声解析の備忘録(目次)

はじめに このブログの記事は以下のサイトに移転しました。より詳細な記事やプログラムの実装方法などは移設先のHPを参照ください。teckonestep.com このシリーズでは私が音声解析・音声処理について学んだことを備忘録として記していこうと思います。 ここ…

ニューラルネットワークとは?

ニューラルネットワークモデルは、ニューロンモデルを単位として構築されます。 ニューロンモデルは脳の神経細胞(ニューロン)の動きから考案されたモデルで、その動きは大きく分けると2つになります。 ①他の神経細胞から電気パルスを受け取る。 ②受け取っ…