波動と機械学習

人間の声を色相の変化を利用して3次元プロットした図に美しさを感じて、そのまま音声解析の道を進んでいます。自分なりに調べて実装できたものから更新していきます。アドバイス、アイデアなどあれば是非お願いします。

話者認識

話者認識とは? 話者認識とは、マイクになどによって録音された音声から個人を認識・特定するコンピュータ処理のことです。 ここで言う「音声」とは人の声のこと指します。つまり、顔の見えない相手の声が、誰の声なのかコンピュータに推測させる分野のこと…

色々な波形を作ってみる(矩形波、三角波、鋸波)

このブログの記事は以下のサイトに移転しました。 より詳細な記事やプログラムの実装方法などは移設先のHPを参照ください。 teckonestep.com この記事では様々な形の周期波形を作成してみます。 作成した波形はそれぞれ特徴的な音色をしており、その違いが楽…

音声の再生と録音

本記事ではマイクから音声を録音、スピーカで再生する方法を記載します。 Pyaudioというモジュールを使用して実装していきます。 音声の再生 音声の録音 音声の再生 音声の録音・再生をする際はPyaudioで継続的にデータを入力or出力をしていきます。 コード…

音声データ(waveファイル)の基礎知識

ここでは音声データを扱う上で知っておくべき用語や知識を整理します。 基本的な用語 パラメータに関する用語 wavデータの構造について 基本的な用語 音源 解析・処理対象となるデータを指す。基本的には全てバイナリデータである。 静的な音源 ファイルに保…

音声データを操作してみる(ファイルの読み込み/書き込み)

この記事では音声データを自在に操れるようになることを目標に以下のことを学びます。 基本的に使用するプログラミング言語はPythonです。必要に応じて外部ツールや多言語にも触れていきます。音声データの基礎知識で学んだことを生かして学習を進めます。wa…

音声解析の備忘録(目次)

はじめに このブログの記事は以下のサイトに移転しました。より詳細な記事やプログラムの実装方法などは移設先のHPを参照ください。teckonestep.com このシリーズでは私が音声解析・音声処理について学んだことを備忘録として記していこうと思います。 ここ…

ニューラルネットワークとは?

ニューラルネットワークモデルは、ニューロンモデルを単位として構築されます。 ニューロンモデルは脳の神経細胞(ニューロン)の動きから考案されたモデルで、その動きは大きく分けると2つになります。 ①他の神経細胞から電気パルスを受け取る。 ②受け取っ…

最尤推定・交差エントロピー誤差(実装編)

今回は3回に分けて学んだ分類問題の実装編です。以前の記事をまだ読んでいない方はあらかじめ目を通しておくことをおすすめします。 確率の導入 最尤推定・交差エントロピー誤差(1) 最尤推定・交差エントロピー誤差(2) まずは手順の再確認です。 実装に躓い…

最尤推定・交差エントロピー誤差(2)

前回:最尤推定・交差エントロピー誤差(1)に引き続き進めていきます。 まだご覧になっていない方は、前回記事から見ることをオススメします。 今回は今までやってきたことの総まとめです。分類問題の最後ですので頑張りましょう。 上記の図は今まで学んでき…

最尤推定・交差エントロピー誤差(1)

前回:確率の導入では分類の問題に確率を用いるメリットと、シグモイド関数について解説してきました。 今回からはそのシグモイド関数の形の決定について扱っていきましょう! 少し長いので2回に分けて学んでいきます! 問題:体重データから性別を推定する…

確率の導入

前回まではデータの散らばりを「それっぽい直線」を考えることによって学習する回帰を扱ってきました。 今回からはあるデータ群を複数のグループ(クラスタとも呼ぶ)に分類する問題に取り組みましょう。そのためには確率の考え方が必要不可欠になってきます…

線形基底関数モデル(実装編)

前回:線形基底関数モデル(理論編)で紹介した内容を実際にプログラミングしていきます。以前学んだ内容もバージョンアップ(より一般化)してもう一度組み直してみます。 では始めて行きましょう↓ 線形基底関数モデルの実装 1.データの準備 今回採集された…

線形基底関数モデル(理論編)

前回:勾配降下法(理論編)まではデータ点がある直線的な分布で得られると仮定してフィッティングを行ってきました。 しかし、データの中には明らかに直線的な分布にならないデータもあるはずです。 そこで、複雑に曲がったデータの分布を線形回帰で表現す…

勾配降下法(実装編)

今回の記事では勾配降下法の実装を行います。 理論の勉強をしたい方は前回:勾配降下法(理論編)を参考にしてください。また、今回用いるデータセットは最小二乗法(実装編)で作成したものをそのまま使っていきます。では、始めていきましょう。 勾配降下…

勾配降下法(理論編)

前回:最小二乗法(理論編)ではデータに対してそれっぽい直線を引くことを考えました。そのために誤差が最小になるような直線のパラメータ(a,b)を推定する問題を解きました。 今回はそのパラメータを推定する手段(プロセス)として「勾配降下法」を解説…

最小二乗法(実装編)

今回は最小二乗法(理論編)で解説したものを実際にプログラミングによって実装していきたいと思います。そのための開発環境は以下の通りです。 Python jupyter notebook Pythonはインタプリタ型のプログラミング言語で、可読性の高さや機械学習・解析学など…

最小二乗法(理論編)

今回は最小二乗法について解説します。 まず解説の前に私が機械学習の勉強をする際に意識していることをお伝えします。 それは自分が今学んでいる技術・仕組みはアイデアなのかプロセスなのかということを明確にすることです。 「アイデア」は問題をどのよう…

機械学習とは?

前回記事では数学的な知識を使わずに人工知能と機械学習の違いについて書かせていただきました。 抽象的になりすぎて分かりずらかったかもしれません。(すみません…) 今回の記事では機械学習についてもっと詳しく解説します。 機械学習とは? さて、前回記事…

人工知能(AI)とは?

今回の記事では人工知能とは?機械学習とは?といった基本的な知識を我々の中で共有しておきましょう。 1.人工知能とは 最初に「人工知能」という言葉の定義を先に済ませておきます。 人工知能とは… 「人間と同等の知能を再現しようとする取り組みや技術の総…

機械学習の備忘録(目次)

はじめに このブログの記事は以下のサイトに移転しました。より詳細な記事やプログラムの実装方法などは移設先のHPを参照ください。teckonestep.com このブログでは私が今まで学び、利用してきた機械学習についての知識を記していこうと思います。 私として…

波動の魅力についての主観

初めてのブログ記事の投稿になります。 この記事では私の自己紹介の意味も踏まえながら、私がなぜ音や光といった波動の世界に興味を持ったのか綴っていこうと思います。 皆さんはクリスマスが近づいてくると、駅前などがイルミネーションで輝いている光景を…