<del id="d4fwx"><form id="d4fwx"></form></del>
      <del id="d4fwx"><form id="d4fwx"></form></del><del id="d4fwx"><form id="d4fwx"></form></del>

            <code id="d4fwx"><abbr id="d4fwx"></abbr></code>
          • 分詞代碼java jieba分詞代碼

            java如何分詞??

            如果你的分詞規(guī)則是在一個(gè)字符串的開頭和結(jié)尾加上"_",然后兩個(gè)字符一分的話,代碼可以這樣寫:

            創(chuàng)新互聯(lián)是一家集網(wǎng)站建設(shè),西湖企業(yè)網(wǎng)站建設(shè),西湖品牌網(wǎng)站建設(shè),網(wǎng)站定制,西湖網(wǎng)站建設(shè)報(bào)價(jià),網(wǎng)絡(luò)營銷,網(wǎng)絡(luò)優(yōu)化,西湖網(wǎng)站推廣為一體的創(chuàng)新建站企業(yè),幫助傳統(tǒng)企業(yè)提升企業(yè)形象加強(qiáng)企業(yè)競爭力。可充分滿足這一群體相比中小企業(yè)更為豐富、高端、多元的互聯(lián)網(wǎng)需求。同時(shí)我們時(shí)刻保持專業(yè)、時(shí)尚、前沿,時(shí)刻以成就客戶成長自我,堅(jiān)持不斷學(xué)習(xí)、思考、沉淀、凈化自己,讓我們?yōu)楦嗟钠髽I(yè)打造出實(shí)用型網(wǎng)站。

            import java.util.ArrayList;

            import java.util.List;

            public class Participle

            {

            private static final String HEAD_END_STR = "_";

            private static final int PARTICIPLE_LENGTH = 2;

            public static void main(String[] args)

            {

            String exampleWord = "計(jì)算機(jī)";

            exampleWord = "_" + exampleWord + "_";

            int length = exampleWord.length();

            ListString result = new ArrayListString();

            for (int i = 0; i length - 1; i++)

            {

            String str = exampleWord.substring(i, i + PARTICIPLE_LENGTH);

            result.add(str);

            }

            System.out.println(result);

            }

            }

            輸出結(jié)果:_計(jì), 計(jì)算, 算機(jī), 機(jī)_

            java語言中文分詞程序怎么編寫分詞程序正

            現(xiàn)可以提供兩種思路:

            1.String或是StringBuffer(建議用) 中的indexOf("中華")方法,查找給定的的字符串中是否有給定詞表中的詞。

            2.借鑒編譯原理中的狀態(tài)裝換的思想。

            先編寫一個(gè)狀態(tài)機(jī),用于測試給定字符串中的詞是否滿足詞表中的內(nèi)容。

            寫在最后:1)建議使用第一種方法,因?yàn)樵趈ava 內(nèi)部實(shí)現(xiàn)的查找操作其實(shí) 和你想得思路是相同的,不過他的效率會高些。

            2)如果個(gè)人的編程能力比較強(qiáng)或是不考慮效率只是想實(shí)現(xiàn)專有的分詞算法??梢允褂玫诙N方法。

            3)以上的兩種方法都可以使用多線程來提高程序的效率。

            java編個(gè)中文分詞的程序

            import?java.io.Reader;

            import?java.io.StringReader;

            import?org.apache.lucene.analysis.*;

            import?org.apache.lucene.analysis.cjk.CJKAnalyzer;

            import?org.apache.lucene.analysis.cn.ChineseAnalyzer;

            import?org.apache.lucene.analysis.standard.StandardAnalyzer;

            import?org.mira.lucene.analysis.MIK_CAnalyzer;

            public?class?JeAnalyzer?{

            public?static?void?testStandard(String?testString)?{

            try?{

            Analyzer?analyzer?=?new?StandardAnalyzer();

            Reader?r?=?new?StringReader(testString);

            StopFilter?sf?=?(StopFilter)?analyzer.tokenStream("",?r);

            System.err.println("=====standard?analyzer====");

            Token?t;

            while?((t?=?sf.next())?!=?null)?{

            System.out.println(t.termText());

            }

            }?catch?(Exception?e)?{

            e.printStackTrace();

            }

            }

            public?static?void?testCJK(String?testString)?{

            try?{

            Analyzer?analyzer?=?new?CJKAnalyzer();

            Reader?r?=?new?StringReader(testString);

            StopFilter?sf?=?(StopFilter)?analyzer.tokenStream("",?r);

            System.err.println("=====cjk?analyzer====");

            Token?t;

            while?((t?=?sf.next())?!=?null)?{

            System.out.println(t.termText());

            }

            }?catch?(Exception?e)?{

            e.printStackTrace();

            }

            }

            public?static?void?testChiniese(String?testString)?{

            try?{

            Analyzer?analyzer?=?new?ChineseAnalyzer();

            Reader?r?=?new?StringReader(testString);

            TokenFilter?tf?=?(TokenFilter)?analyzer.tokenStream("",?r);

            System.err.println("=====chinese?analyzer====");

            Token?t;

            while?((t?=?tf.next())?!=?null)?{

            System.out.println(t.termText());

            }

            }?catch?(Exception?e)?{

            e.printStackTrace();

            }

            }

            public?static?String?transJe(String?testString,?String?c1,?String?c2)?{

            String?result?=?"";

            try?{

            Analyzer?analyzer?=?new?MIK_CAnalyzer();

            Reader?r?=?new?StringReader(testString);

            TokenStream?ts?=?(TokenStream)?analyzer.tokenStream("",?r);

            Token?t;

            while?((t?=?ts.next())?!=?null)?{

            result?+=?t.termText()?+?",";

            }

            }?catch?(Exception?e)?{

            e.printStackTrace();

            }

            return?result;

            }

            public?static?void?main(String[]?args)?{

            try?{

            String?testString?=?"中文分詞的方法其實(shí)不局限于中文應(yīng)用,也被應(yīng)用到英文處理,如手寫識別,單詞之間的空格就很清楚,中文分詞方法可以幫助判別英文單詞的邊界";

            System.out.println("測試的語句????"+testString);

            String?sResult[]?=?transJe(testString,?"gb2312",?"utf-8").split(",");

            for?(int?i?=?0;?i??sResult.length;?i++)?{

            System.out.println(sResult[i]);

            }

            }?catch?(Exception?e)?{

            e.printStackTrace();

            }

            }

            }

            jar包??

            lucene-analyzers-2.4.1.jar

            lucene-core-2.4.1.jar

            IKAnalyzer2.0.2OBF.jar

            本文名稱:分詞代碼java jieba分詞代碼
            文章起源:http://www.jbt999.com/article4/hgcsoe.html

            成都網(wǎng)站建設(shè)公司_創(chuàng)新互聯(lián),為您提供移動網(wǎng)站建設(shè)、定制開發(fā)、虛擬主機(jī)、用戶體驗(yàn)、網(wǎng)站策劃、營銷型網(wǎng)站建設(shè)

            廣告

            聲明:本網(wǎng)站發(fā)布的內(nèi)容(圖片、視頻和文字)以用戶投稿、用戶轉(zhuǎn)載內(nèi)容為主,如果涉及侵權(quán)請盡快告知,我們將會在第一時(shí)間刪除。文章觀點(diǎn)不代表本網(wǎng)站立場,如需處理請聯(lián)系客服。電話:028-86922220;郵箱:[email protected]。內(nèi)容未經(jīng)允許不得轉(zhuǎn)載,或轉(zhuǎn)載時(shí)需注明來源: 創(chuàng)新互聯(lián)

            h5響應(yīng)式網(wǎng)站建設(shè)

              <del id="d4fwx"><form id="d4fwx"></form></del>
              <del id="d4fwx"><form id="d4fwx"></form></del><del id="d4fwx"><form id="d4fwx"></form></del>

                    <code id="d4fwx"><abbr id="d4fwx"></abbr></code>
                  • 欧美一区二区三区四区视频 | 成人久久 挤奶 | 日皮中文字幕 | 亚洲视频免费在线收看 | 国精产品一区一区三区有限是什么 |