t_room

t-Room:システム開発,画像処理

CS研によって開発されたt-Roomが本来持っている機能を基盤にしつつ,若本独自の視点から共創研独自のt-Roomの形を創り出します. 既存の機能を最大限に利用し,

  • 有用性の向上
  • 快適性(娯楽性を含む)
  • 操作性の向上
  • メディア再生品質の向上
などを実現することによって新たな価値を付加し,t-Roomをより良いシステムに進化させます. 一同が一丸となって,t-Roomをさらに豊かなコラボレーション支援システムとして発展させよう.

t-Room:ネットワーク

t-Roomは大型のディスプレイとカメラ,スピーカ,マイクなどのマルチメディア機器に囲まれた空間どうしを高速ネットワークで接続する通信システムであり,そこで扱われる計算量の大きさ故に多数かつ多様なメディア処理サーバから構成されています. 私たちのグループではt-Roomどうしを接続する通信ネットワークに様々なネットワーク制御を可能とする機能を実現し,ネットワークの観点からより快適性(娯楽性を含む),メディア再生品質の向上を目指した研究を行っています.

具体的には遠隔同時演奏システムの構築,制御システムにより制限された通信リソースの下で,利用者にとって望ましい品質をもたらすデータ量や通信インフラの設定,より使いやすいものとするためのメディア処理サーバの一元管理システム,多数かつ多様なメディアの時刻同期システムの構築,これらの動作検証を行っています.

またt-Roomはこれまで商用の光ネットワークを用いて通信していましたが,今年度からは商用ネットワークの数十倍にも及ぶ能力を持つ次世代学術情報ネットワークSINET3を利用することになりました. これからはこの強力なネットワークを用いて多数のt-Roomを同時に接続する多地点接続の実験なども行う予定です.

パターン認識

パターン認識とは,処理対象として入力されたデータを,予め想定したいくつかのカテゴリの中の一つに対応付けて分類する処理を意味します. 応用分野としては音声からの発話内容の特定,手書き文字の認識,ゲノム解析など,多岐にわたります.

私たちパターン認識グループの研究内容は大きく分けて2種類あります.

一つは従来手法よりも汎化能力の高い,新しい学習(訓練)アルゴリズムの開発です. パターン認識を行う際には,まず初めにあらかじめ正解のわかっているデータを用意してシステムを訓練しますが, そのシステムの性能を評価するためには,訓練に用いたデータとは別のテスト用のデータを使わなければなりません. 汎化能力とは,訓練用のデータだけではなく,テスト用のデータに対しても高い認識性能を実現できる能力のことです. この汎化能力の高いシステムを実現するために,統計的な理論を用いて研究を行っています.

もう一つは,様々なパターン認識のアルゴリズムを自由に選択して実験をすることが可能な,汎用パターン認識 ライブラリの開発です.新たなアルゴリズムを開発した際には,その手法と従来手法との比較を行って,新たな手法の有効性を示さなければなりません. しかし,その度にプログラムをゼロから作り直していては効率が悪いので,どのアルゴリズムでも実装が変わらないような部分は共通のモジュールとして扱い, 異なる部分だけを簡単に入れ替えることができるような設計が求められます. 汎用パターン認識ライブラリでは,Javaのオブジェクト指向の考え方を利用して,このような設計を実現しています.

音響信号処理

我々音響信号処理グループでは遠隔コラボレーションシステムにおける音像定位の向上を目指しています. 両耳間時間差,両耳間音圧差や信号の周波数領域,収音方法等がスピーカ受聴時の音像定位に与える影響を調べる実験を行ってきました. 実験結果の分析を基に,遠隔コラボレーションシステムでの音通信系の開発を進めていく予定です.

データマイニング

データマイニングは,株価・医療データ・気象データなどのように,日々蓄積されていくような大規模のデータから,役立つ知見や新しい知識を発見しようとするものです. 医療分野では,電子カルテのように医療検査データを蓄積できるようになってきたことから, "蓄積された過去のデータを分析し,医療に役立てたい"というニーズが高まっています. データマイニンググループでは,統計解析,時系列解析などをベースに,医師の医療判断に役立つ論理的根拠を提供することを目指しています.