Baidu コーパスダウンロード広場(Baidu Japan Corpus Downloads)

Baiduでは、自然言語処理に興味を持たれていたり、学んでいたり、研究されている方や、おもしろいものを作ってみたいエンジニアの方に向けて、研究や非商用のサービス開発などの目的に利用いただけるコーパスを公開しています。

今後も様々なコーパスの公開を予定(不定期)していますので、どうぞご期待ください○┓ペコリ

<ご注意>
Baidu コーパスの利用にあたっては、必ず以下の利用条件をお読みください。

Baidu ブログ・掲示板時間軸コーパス

2010年8月公開

Baidu 絵文字入りモバイルウェブコーパス

2010年6月公開

一般に公開されているAPIやプライベートなAPI、あるいは以下のBaidu絵文字入りモバイルウェブコーパス(Baiduがウェブから抽出した絵文字を含む日本語データから作成したNグラムデータ)です。

なお、本コーパスは、2010年7月に開催した「王冠 Baidu.jp不自然言語処理コンテスト」の発表を機に公開されました。