スキップしてメイン コンテンツに移動

投稿

声紋・ソノグラム・スペクトルグラム

声紋(sonogram, spectrogram)は野鳥の声の分析に不可欠なツールです。横軸に時間、縦軸に周波数を取って、音の強さを色で表示します。 ここで用いられている処理は、音声である波形を周波数の信号に変換する時間−周波数変換(フーリエ変換)です。フーリエ変換するときに幾つかの調整できるパラメータがありそれぞれがどう関係しているのかをまとめてみました。案外、まとめて書かれているものがありません。そのため自分で調べました。厳密に定義しているのではなく備忘録です。初心者向けにコ ーネル大学の作成したCanary/Ravenのマニュアルの付録に鳥の声のスペクトル解析の章 がありこれを参考にしています[1]。 音声データのパラメータ 波形とは時間に対する強度が連続的に変化する信号を表します。音声は波形であり、ICレコーダは連続の波形を離散化(デジタル化)されて記録されます。離散化された信号も波形と呼びまし、今はディジタル信号を意味する事が多いです。 連続な信号をとびとびの信号で表すので失われる情報があります。しかし、必要とする周波数帯域の2倍以上でサンプリングレート(サンプリング周波数)で離散化すれば完全に復元できるとシャノンさんが証明しました。 この関係は、次の表のようになります。 サンプリングレート(SR) 標本点の周期(ΔT) 192KHz 5.2μs 96KHz 10.42μs 48KHz 20.83μs 44.1KHz 22.67μs 音を声紋(スペクトログラム)にするには短い一定期間の波形データを切り出して(スライス)これを周波数変換し並べます。この短時間の周波数変換を短時間フーリエ変換:STFT(Short Time Fourier Transform)と呼びます。問題はこの時間の選び方です。時間と言っても離散化されているのでその切り出す波形の個数です。切り出された波形をフレームと呼んだりチャンクと呼んだりします。ここではフレームと呼びます。1フレームの波形の個数をフレーム長(Flame Length)と呼びます。各アプリではもっとわかりやすい言葉を使っていますが同じ意味です。 Amadeus Pro : FFT Size Audacity : ウィンドウサイズ 鳥の...

鳥の鳴き声大図鑑(Birder 2017年04月号)を読んで

鳥の鳴き声大図鑑(Birder 2017年04月号)を読んで   最近、本やCDなどレガシーメディアでの鳥の声の情報が増えている。うれしい事だ。これらはきちんと監修されているので信頼に足る事が最大の長所。短所はネット情報に比べて、掛かるコストが高い事だが、監修と信頼がその値段だと思っている。 楽しみにしていた本号であり、書評を若干。 全体を通して前半の記事は特集の意図を汲むものだが、後半の記事はテーマの選び方が散漫な印象。初心者〜ベテランまでバードウォッチャーが本当に知りたい、”知らない声を聞いたんだけど、それは何かどう調べたら良いんだろう”などの疑問には明快には答えてくれない。それでも鳥の声の第一人者で日本野鳥の会理事の松田さんの総論と、25種の解説は知らない事も多く一読の価値がある。また、鳴き声に文法を持つシジュウカラの最新研究はバードウォチャーは必須の知識でもある。 特集のみにフォーカスする。 8個の記事と1つのコラムからなり、特集の説明は「鳥が見つからない原因の80%は鳴き声を知らないからだ!」なので、初心者を意識したものだろう。そのため、最初の記事は松田道生さんに依る「野鳥観察に鳥の声が重要な理由」がうまくまとめられている。鳥は声で見つけるが、日本語に置き換えにくくそのため覚えにくいこと、分からない事も多いが地鳴きは鳥の気持ちを表し、鳥の気持ちがわかるバードウォッチングができるなんて考えると楽しくなると締める。 その後、覚えておきたい25種の鳥の声の解説がある。1番のヒヨドリから、シジュウカラ、カワラヒワ、など25番のアオバヅクまで続く。それぞれの解説には短いながら”おお、そうなんだ”と松田さんならではの説明がある。中でも気になったのはヒヨドリの地鳴きとさえずりがはっきりしないこと、コゲラのドラミングは10分以上続けうること。また、キジバトのデデポポはさえずりとして取り扱っている点も興味深い。ハトのさえずりについてナワバリ宣言の機能もあるのかなどもっと伺ってみたい。 梅垣佑介さんによる「鳥を見える化するソナグラムの活用」は最も期待していた記事だ。記事ではソナグラムを用いた識別の例としてニシオジロビタキとオジロビタキの震える声(トリル)の違い、エゾムシクイとアムールムシクイの声の高さの違いを挙げて種識別できると説明し...

サンショウクイの亜種同定に挑戦

今日(2017-03-17)、サンショウクイの声を聞いた。 この冬中、この近辺に居た亜種リュウキュウサンショウクイかと思ったが、ひょっとして亜種サンショウクイが渡って来たのかもしれない。 今日聞いたサンショウクイの声はこちら→ ♪ 。高速道路の脇でたまたま録音できたが雑音が激しい。低音をカットしてノイズ除去してみた。 3月中旬と渡りには早いと思われる。時期的に微妙なので、三上2016による判定を行った。詳しくは こちら 。 第3音節の解析 もとめるのは6つの音声要素パラメータ。   a : 先頭の周波数,   b : 第一音素の最高周波数,   c : 最高周波数,   d : 最後の音素の最高周波数,   e : 節 の長さ,   f : 最大音圧の周波数, これらを声紋と音節全体のスペクトルでfを求めた。用いたのはAmadeusProVer.2.3.1を使用。FFTサイズは512ポイント。 ヒリリリを一つの音節とすると第1音節は途中から始まるのでNG、第2−4を分析すると次のようになった。声紋の音圧を示す色から最大値を読取った。三上(2016)に依ると判定値が正なら亜種リュウキュウサンショウクイの可能性が高く、負なら亜種サンショウクイの可能性が高い。 判定結果:   # a b c d e f 判定値 第2音節 5156 5453 5703 5640 311 5587 0.23667 第3音節 4859 5281 5620 5468 331 5423 -0.28205 第4音節 5015 5226 5778 5625 540 5383 0.00429 (単位:eはms、それ以外はHz) 微妙な判定値だ。 b-dは-187, -187, -399(Hz) でどれも負。しかし、音の高さ(f)は5500Hz前後で亜種リュウキュウサンショウクイの分布に重なる。 さーてどっちでしょう。 <2017−03−20> リュウキュウサンショウクイでいいようです。三上さんに確認して頂きました。ありがとうございます。以下も参考になるとか。 亜種リュウキュウサンショ...

Mathematicaで鳥の声解析 (BPF:Band Pass Filter)

鳥の声の分析はオープンソフトの"R"や"Amadeus Pro(MacOSX)"を用いて来た。 所がである。声紋(ソナグラム)をもっと詳細に分析したいと思ったのだが、なかなが歯が立たない。Amadeusはソナグラムはもちろん表示できるが、瞬時周波数の表示が面倒なのだ。Audacityは使い勝手が悪いし。 そこで買ったままになっていたMathematica 9.0を再び起動させることにした。今はver.11にアップデートしませんかと催促のメールが来るが今のところ放置。 という訳で、MacOSXのTerminalからMathematicaで作ったプログラムをフィルタのように使いましょうというお話。 コマンドラインからMathematicaを起動してパラメータも渡し、結果をUNIXコマンドみたいにパイプに渡すことができる。 今回作ったのは、バンドパスフィルタ(BPF)のフィルタ。 MacOSXのTerminalからこんな感じで使います。 $ ./BPF.m input.wav output.wav 1000 14000 1番目のパラメータは自分のコマンド(BPF.m)だとして、2番目は入力音声データ、3番目は出力データ、4番目は低い方のカットオフ周波数、5番目は高い方のカットオフ周波数。 $ vi BPF.m     1 #!/ Applications / Mathematica . app / Contents / MacOS / MathematicaScript - script   2    3 (* BPF.m : BandPassFilter *)   4 If [ Length [ $ScriptCommandLine ] < 4 ,   5  Print [ "programname=BPF.m (mathematica script ver.1.3):入力波形(モノラル)にバンドパスフィルタをフィルタを掛けて波形出力する" ]   6  Print [ " Usage:Ver1.3 Fourier変換のための個数を偶数化する" ] ...

ファーストインプレッション [ZOOM H6]

この週末土日の午前中に新規購入したマルチチャネルトラックICレコーダH6(Zoom)を連れて鳥見に行って来た。その第一印象(First Impression)。 初日、冬晴れの中、里山を歩いた。 この日は本体H6と付属のステレオマイク2本をそれぞれ試した。 まず付属のマイクカプセル『XYH-6』。その場でモニターはヘッドフォン(Sony社製MDR-1R)使用。 一般的に小鳥の声は小さい。そのため、ニアフィールドで録音する楽器用とか大音量のライブ録音用に作られたICレコーダは小信号録音が苦手だ。つまり感度を高めるため入力ゲイン(+再生ボリューム)を上げるとサーというホワイトノイズが気になってしまう。 H6+XYH-6でも同じだった。マイクのメインゲイン(ボリューム)を10まで上げないと、ホオジロ類の声は満足に録れなかったが、そうするとサーと言う音が気になった。 音質はなかなかいい。一緒に歩いた仲間の声も自然だ。 単一指向性のマイクカプセルが90度の角度で配置されているが、本体軸方向と、これに鉛直な方向の雑音の分離はそれほど高くない。これは、小川近くの枝に止った小鳥の声を狙うのに、小川の音は小さくしたいから小川が鉛直方向になるようにマイクを配置したりするが、思った程低減効果はない。 H6+MSH-6は音の広がりはナチュラル。環境音を録る場合や音声メモを取る場合にはこちらのマイクが良さそうだ。 MSマイクカプセル『MSH-6』は、センターの音を拾う単一指向性のMid マイクと、左右の音を拾う双指向性のSide マイクによって構成されています。(ZOOM社WEBより) マイク感度は高くない。そのため、ホワイトノイズがゲインを上げるときになる。 外付けのガンマイクもつないでみた。その感想はまた後で。電池もついでに買う事にした。

HDDが死にそうだ

USB3.0のコネクタは本当に信頼性が無い。2.5inchのドライブが入った4TBのUSB-HDDをMacBookProに付けているけど、今日つないでみると認識しない。焦った。HDD側のコネクタがしっかりハマった気がしない。別のケーブルで試してみると、きっちりとハマった気がした。認識したのでホットした。 今のうちにBACKUP取っておかないと。 という訳で選んだのがこれ。6TBのRAIDでこの値段(約35000円)なら安いだろう。 <追記:2017-06-15> MacTimeMachineで4TBの鳴き声を含むデータをバックアップしているが、大量のデータを整理するとあっというまに、6TBを使い切る。追加で8TBをシステムに組み込むか。