resume

Japanese Version is available here.

Yohei Yamaguchi / 山口 洋平

I’m working as a software engineer at a web company.
Here is my CV(under construction).


Interests

  • Natural language processing, Data mining, Programming Languages.

Computer Skills

  • Operating Systems: Linux (Ubuntu, Debian, RedHat, FreeBSD), Mac OS X, Windows.
  • Programming Languages: C/C++, Objective-C, Perl, JavaScript, PHP, Node.js, Ruby, OCaml, Python.

Natural Language Skills

  • Japanese: Native
  • English: Advanced – TOEIC score 840 (April, 2012)

Professional Experience

  • Apr. 2012 – Present: Full-time Software Engineer at Yahoo! JAPAN, Tokyo, Japan.
  • Oct. 2011 – Mar. 2012: Teaching Assistant at Kyoto University.
    • supported the lecturer teaching “Media Information Processing” to graduate students
  • Aug. 2010 – Sep. 2010: Research Internship at NTT Communication Science Laboratories, Kyoto, Japan.
  • (Mentor: Jun Suzuki)
    • researched about the language analysis of a large-scale Japanese web text.
    • developed a robust text analyzer for the Japanese web text, which can exectute the word, segment and sentence segmentation simultaneously.
  • Mar. 2009 – Oct. 2009: Part-time Developer at System-in, Kyoto, Japan.
    • developed an online order management system by myself.
    • This system has been used by Torikizoku, which is a popular Japanese style bar found almost everywhere in Japan.

Education


Product

  • Wikipediaコーパス作成

    Wikipediaからダウンロードできるデータを使って、仮名漢字変換で利用できるコーパスを作成する方法について書いています。

  • SIMPLEの2-gram版

    2-gramモデルベースの仮名漢字変換エンジンを公開しています。

  • 言語モデル配布ページ

    ウェブページから作成した音声認識用と仮名漢字変換用のN-gramを配布しています。

  • トピックモデルのサーベイ

    トピックモデルのサーベイをしています。主にLDA、LDAの言語モデルでの応用。

  • mksc

    疑似確率的コーパスを生成するプログラムを公開しています。

Publication

  • 山口 洋平、森 信介、河原 達也
    仮名漢字変換ログを用いた講義音声認識のための言語モデル適応
    言語処理学会第18回年次大会(NLP2012)、広島、March 2012
  • 山口 洋平、森 信介、河原 達也
    変換ログを用いた仮名漢字変換精度の向上 [論文、スライド(pptx, pdf)]
    言語処理学会第17回年次大会(NLP2011)、豊橋、March 2011.
  • 山口 洋平
    変換ログを用いた仮名漢字変換精度の向上、
    第2回入力メソッドワークショップ(IME2010)、京都、December 2010.
  • 山口 洋平、中澤 巧爾
    古典シークエント計算の強正規化可能性の構文論的証明(ショートプレゼンテーション), 
    第12回プログラミングおよびプログラミング言語ワークショップ(PPL2010), 香川, March 2010.

Leave a Reply

Your email address will not be published. Required fields are marked *