研究

大学院生が研究ネタを見つける4つの方法(具体例付き)

今年3月に博士号取得予定です。学部4年生のころから、ずっと同じ研究室に所属し続けたおかげか、自分の研究に加え、後輩との共同研究もたくさん行うことが出来ました。その結果、博士論文提出時のジャーナル・国際会議・国内会議の論文数をすべて合計する…

時刻tじゃない音声認識

去年の12月,古井先生が「なにかが足りない音声認識研究」というタイトルで発表をなさった. 現在までの音声認識研究を振り返った上で,「なにかが足りない,けどそれがなにかは知らない」という内容. かなり刺激的なお話だったので,各地からいろんな反響…

Nonnegative Sparse Linear Discriminant Analysis

物理的な意味解釈が可能な特徴量ベクトルを次元圧縮したいときには,非負な変換を使って次元圧縮を使うのが良い.非負な変換を使わないと,物理的意味解釈ができなくなってしまう.それから,次元圧縮後のデータの意味づけがしやすくなるという点で,スパー…

英語の勉強

英語での発表準備が全然はかどらない. 実験や議論,パターン認識や機会学習の勉強は,楽しいのでどれだけやっていても苦にならないけど,英語の勉強となると急にやる気がなくなってしまう. 「やる気がなくなる」かつ「まだ時間はある」かつ「インターネッ…

8byteのdouble型の0より大きい数字の最小値

1-e323。 浮動小数点型に丸め誤差が含まれるのは百も承知だったけど、それなのに、今、これのせいで非常に困っている。1-e323って、意外と大きい。logとったらたったの-743.7469247408213よ?(doubleの精度で。) 面倒だけど、問題を回避できるようにコード…

perlでpackとunpack

http://perldoc.perl.org/functions/pack.html packやunpackのテンプレートには,強制的にbig endianにしたりlittle endianにしたりできる補助記号なんてのがあったのね...HTK形式の特徴量ファイルへの書き出しに小一時間もハマってしまった... 正解は…

竹内研

東大と産総研、書き込み速度が従来の2倍になった高速なSSDを開発 竹内研のブログ 世の中にインパクトを与える研究ができるのは,少し羨ましい... 同じ電気系として,僕もがんばりたいです.電気系には夢がつまってんよ!!人気ないけど.

ジェネラティブな脳

脳の中で,音楽を再生することができる. そのとき,鼓膜は振動していない.つまり,物理的に音楽はそこに存在していない. なのに,我々はその音を「聞く」ことができる. - ジェネラティブな脳 声でも同様の現象がおこる. よく知っている人が何か話してい…

realtime straight

straightライブラリがついにでた!!板野先生、森勢さん、ありがとうございます!! これで、リアルタイムで高品質な音声分析再合成系を構築できるようになります。http://www.crestmuse.jp/cmstraight/index.php?STRAIGHT%20Wiki

はじめての研究会発表

6月27〜28日に札幌のACUで開催された、音声研究会/聴覚研究会/音声学会(SP/H/PSJ)共催の研究会で発表してきました。 やはり、というかなんというか、うまく内容を伝えられませんでした。不完全燃焼感でいっぱいです。うはあ。そこで、なぜ自分の発表がだ…

praatscript

praatscriptを実行するとき,いつもPraatのGUIを立ち上げてRun scriptしてたけど,そんなことしなくても praat doit.praatscriptでいけるらしい. →http://www.fon.hum.uva.nl/praat/manual/Scripting_6_9__Calling_from_the_command_line.htmlpraatscriptの…

HListG beta ver.

HListの結果をgnuplotで表示するためのスクリプト。やっつけなかんじでつくってみた。 #! /usr/bin/perl use Getopt::Std; my %option; my $numstate = 0; getopts("n:h", \%option); if ( exists $option{n} ){ if ( defined $option{n} ){ $numstate = $op…

libm.a

いわずとしれたmathライブラリですが、僕の環境で動いてくれません(涙 lmオプションつけてコンパイルすると、ldがlibm.aをみつけてくれるんですが、skipping incompatible /usr/lib/libm.a when searching for -lmとかいって華麗にスルーしてしまい、結局ca…

HTK

HTKが定義する特徴量(MFCC)の抽出処理が,なんだか気持ち悪い. 「なんでそんな処理をそこでするの?」っていう部分がある. HCopyつかわずにSPTKか自力で特徴量抽出したほうがいい気もしてきた.けど,やっぱりMFCCは認識率がいいんだよなあ.

暇になった

音響学会の全国大会に投稿しようと思ってたんだけど,だすのやめた(だせなかった)ので,暇になりました.暇なので昨日のことをメモ. 人工知能学会AI-Challenge研究会 人工知能学会の,音響関係のセッション.音源定位と音源分離の発表は理解できない部分…

音声認識技術を実際に使うとき

経済産業省「音声認識技術の開発」中間成果報告会に行ってきた.面白そうだったこと,印象に残ったことをいくつかメモ. 車に乗っている人は 運転中の人というのは,「ある種のハンディキャップを背負っている」ととらえられる.ドライバーがカーナビを見る…

HRestが認識できるファイル

HCopyを使えば,HRestが認識できる.mfcファイルはすぐつくれる.けど,独自のパラメータを使いたい場合(メルケプとかLPCとか以外),HCopyでは対応できないので,自力でHRestが認識できるファイルを作ることになる.参考にするため,HCopyが吐く.mfcファイ…