Solr4.6用csv文件导入数据

196次阅读

共计 1838 个字符，预计需要花费 5 分钟才能阅读完成。

安装好了 solr4.6，今天尝试了下给 collection1 核用 csv 文件批量导入数据。

首先写好 csv 文件（book.csv），这个文件的路径随意放。我的路径是：E:/book.csv。并注意文件的编码，我的编码是 GB2312，一会儿上传的时候要用，如果错了，中文会乱码。

id;title;content
16;” 除夕 ”;” 某主席上台了，除夕就不放假了。”
17;” 钓鱼岛 ”;” 钓鱼岛是中国的，苍井空是世界的 ”

然后修改 schema.xml。把 fields 里面的已经定义好的字段全部清空，但是 ”_version_”，和”_root_“元素保留。字段定义如下：

还需要修改 solrconfig.xml。

将下面的这一段：

<requestHandler name=”/update/csv” class=”solr.CSVRequestHandler”>
<lst name=”defaults”>
<str name=”stream.contentType”>application/csv</str>
</lst>
</requestHandler>

替换为：

separator 字段表示每行数据各个字段是用分号分开的。

所有的修改完之后，重启 tomcat。如果是 windows 下，直接在浏览器地址栏里执行下面这个 http 请求即可：

http://localhost:8080/solr/update/csv?commit=true&stream.file=E:/book.csv&stream.contentType=text/plain;
charset=GB2312

说明一下，commit=true 这个必须有，不然插入数据不会成功。E:/book.csv，这个是文件的绝对路径。;charset=GB2312 这个是我的 csv 文件的文件编码方式，这个一定要弄清楚，否则中文乱码。

执行完之后，查看结果：

Solr4.6 用 csv 文件导入数据

Solr 的详细介绍 ：请点这里
Solr 的下载地址 ：请点这里

相关阅读：

Solr3.6.1 在 Tomcat6 下的环境搭建 http://www.linuxidc.com/Linux/2013-01/77664.htm

基于 Tomcat 的 Solr3.5 集群部署 http://www.linuxidc.com/Linux/2012-12/75297.htm

在 Linux 上使用 Nginx 为 Solr 集群做负载均衡 http://www.linuxidc.com/Linux/2012-12/75257.htm

Linux 下安装使用 Solr http://www.linuxidc.com/Linux/2012-10/72029.htm

在 Ubuntu 12.04 LTS 上通过 Tomcat 部署 Solr 4 http://www.linuxidc.com/Linux/2012-09/71158.htm

Solr 实现 Low Level 查询解析（QParser）http://www.linuxidc.com/Linux/2012-05/59755.htm

基于 Solr 3.5 搭建搜索服务器 http://www.linuxidc.com/Linux/2012-05/59743.htm

Solr 3.5 开发应用教程 PDF 高清版 http://www.linuxidc.com/Linux/2013-10/91048.htm

Solr 4.0 部署实例教程 http://www.linuxidc.com/Linux/2013-10/91041.htm

正文完

星哥玩云-微信公众号

发表至：服务器应用

2022-01-20

0

转载说明：除特殊说明外本站文章皆由CC-4.0协议发布，转载请注明出处。

Nginx会话保持之nginx-sticky-module模块

Nginx-rtmp+ FFmpeg +Docker + vue.js 直播系统搭建

Ubuntu Linux系统下Apache Maven的安装和配置

基于HAproxy的Web动静分离及输出状态检测页面

cwRsyncServer实现从Windows下数据实时同步到Linux服务器

CentOS 7.5下部署GlusterFS分布式存储集群环境

Nagios监控流量脚本

修改ibdata1大小的验证以及如何使用mysqld_multi管理多实例

Linux双网卡绑定实现负载均衡(Bonding双网卡绑定)

Solr4.6用csv文件导入数据

选择PHP与Python，可以考虑这三个问题

Centos 7平滑无缝升级PHP7.1.0到PHP 7.1.5

介绍ansible的Ad-hoc与commands模块

Linux安装使用pidstat命令以对进程数据进行监控

linux下使用tree命令以树形结构显示文件目录结构

如何在 Linux 中禁用内置摄像头

并发服务器：Redis案例研究分析

简单介绍常用hadoop dfs命令

案例：php利用淘宝IP库获取用户ip地理位置

Linux下把纯文本文档转换成PDF文件的方法