<p>1、下载solr6.5,windows下载zip,Linux下载.tgz</p>
<p>2、解压</p>
<p>3、window中启动,从cmd中进入到solr的解压目录里的bin目录</p>
<p>执行 solr.cmd start</p>
<p>检查是否启动 solr.cmd status</p>
<p>5、linux中启动 ,进去到solr的解压目录的bin中</p>
<p>执行 solr start</p>
<p>检查solr status</p>
<p>6、启动后从浏览器中输入http://localhost:8983/solr 进入到solr主页</p>
<p>7、linux下创建core</p>
<p>bin/solr create -c my_core</p>
<p>8、找到solr-6.5/server/solr/下的my_core/conf</p>
<p>编辑solrconfig.xml</p>
<p>在底部</config>上增加</p>
<p><!-- 配置数据导入 --></p>
<p><requestHandler name="/dataimport" class="solr.DataImportHandler"><br />
<lst name="defaults"><br />
<str name="config">db-data-config.xml</str><br />
</lst><br />
</requestHandler><br />
在75行左右的lib标签中增加</p>
<p><lib dir="${solr.install.dir:../../../..}/dist/" regex="solr-dataimporthandler-.*\.jar" /><br />
<!-- for HMMChineseTokenizerFactory --><br />
<lib dir="${solr.install.dir:../../../..}/contrib/analysis-extras/lucene-libs/" regex="lucene-analyzers-smartcn-\d.*\.jar" /><br />
9、配置my_core/conf/managed-schema在倒数第二行添加对中文分词的支持和过滤html标签</p>
<p><fieldType name="text_smartcn" class="solr.TextField" positionIncrementGap="0"><br />
<analyzer type="index"><br />
<tokenizer class="solr.HMMChineseTokenizerFactory"/><br />
</analyzer><br />
<analyzer type="query"></p>
<p><charFilter class="solr.HTMLStripCharFilterFactory"/><br />
<tokenizer class="solr.HMMChineseTokenizerFactory"/><br />
</analyzer><br />
</fieldType><br />
10、my_core/conf下新建db-data-config.xml,配置数据导入的数据源,内容如下</p>
<p>添加 transformer="HTMLStripTransformer" stripHTML="true"是支持过滤疑似html标签的内容<br />
convertType 是支持clob大字段<br />
<?xml version="1.0" encoding="UTF-8"?> <br />
<dataConfig> <br />
<dataSource name="source1" type="JdbcDataSource" driver="com.MySQL.jdbc.Driver"<br />
url="jdbc:mysql://localhost:3306/baike?failOverReadOnly=false&amp;autoReconnect=true&amp;characterEncoding=utf8&amp;characterSetResults=utf8" user="root1" password="root" batchSize="-1"convertType="true" /> <br />
<document> <br />
<entity name="baike" pk="id" dataSource="source1" query="select t.ID, ty.`NAME`, t.TITLE, t.CONTENT, t.KEYWORD from VOCABULARY_ENTRY t,VOCABULARY_TYPE ty where t.TYPE_ID=ty.ID" transformer="HTMLStripTransformer"><br />
<field column="id" name="id"/> <br />
<field column="NAME" name="vocabulary_type_s"/><br />
<field column="CONTENT" name="vocabulary_ch_text" stripHTML="true"/><br />
<field column="KEYWORD" name="vocabulary_ch_keyword"/> <br />
<field column="TITLE" name="vocabulary_ch_title"/><br />
</entity> <br />
</document> <br />
</dataConfig></p>
<p>11、my_core下新建lib文件夹</p>
<p>将mysql-connector-Java-5.1.41-bin.jar包放入到lib中</p>
<p>12、重启solr</p>
<p>bin/solr restart -p 8983</p>
<p>13、通过http://192.168.242.5:8983/solr/#/baike_core/schema</p>
<p>配置db-data-config.xml中用到的filed</p>