Textcat言語識別コード
Textcat言語識別コード
Google言語検出API。 言語に依存しない話者識別のためのアルゴリズム。 言語を自動検出するスペルチェッカー。 Googleに対してさまざまな言語識別アルゴリズムを簡単にベンチマークできます。特に、文章が非常に短いtwitterのようなサービスにアルゴリズムが使用される場合、単一の単語と小さな文章でテストすることは良い指標です。リソース。言語識別に関するGoogle Scholar検索。 Google言語。 Bing言語検出の根尖切除。 PHPの文字列から言語を検出します。 Kumar shridhar検出言語。 就学前の予測マークアップモデリング言語。 チャーン予測Python言語。 アフリカの予測インデックス言語。 前の回答のcldrパッケージはCRANで使用できなくなったため、インストールが難しい場合があります。ただし、Google(Chromium)のcldライブラリは、他の専用パッケージcld2およびcld3を介してRで使用できるようになりました。複数のヨーロッパ言語で数千のツイートをテストした結果、利用可能なオプションの中で、textcatの信頼性は群を抜いて劣っていると言えます。
テキストから言語を特定します。 HTML言語の検出。 Word文書の言語を検出します。 Textcat、Data Big Bangブログ。
言語とロケールを自動的に検出する方法。 タグ:多言語主義-騒音と聴覚の問題を作ります。 オンラインツールでテキストの言語を特定します。 GitHubでアカウントを作成して、ivanakcheurov / ntextcatの開発に貢献してください。今日からGitHubに参加してください。 GitHubには、コードのホストとレビュー、プロジェクトの管理、およびソフトウェアのビルドを共同で行う4,000万人を超える開発者の拠点があります。
|
امتیاز مطلب : 0
|
تعداد امتیازدهندگان : 0
|
مجموع امتیاز : 0