使用分页导入的方式把大量数据从mysql导入es
创始人
2024-04-20 22:20:59
0

1、首先要有分页功能的代码 

如何使用mybatis-plus实现分页,可参考

http://t.csdn.cn/ddnlk

2、要创建feign远程调用模块

可以参考

http://t.csdn.cn/gshFw

3、在feign模块中声明远程调用接口

1.在feign模块中创建一个接口,名字可以是你要调用的服务名+client

 2.接口中的代码为要调用的方法,也就是分页方法

package com.hmall.config;import com.hmall.common.dto.Item;
import com.hmall.common.dto.PageDTO;
import org.springframework.cloud.openfeign.FeignClient;
import org.springframework.web.bind.annotation.GetMapping;
import org.springframework.web.bind.annotation.RequestParam;/*** 商品模块的远程调用** @author ning* @since 2022/12/9 18:39*/
//表示对应的是itemservice服务器
@FeignClient("itemservice")
public interface ItemClient {//分页查询//Item为数据库的实体类,需要复制一份到Feign模块,//注意,复制过来的实体类,只需要属性和构造方法,其他的不需要,否则会报错@GetMapping("/item/list")public PageDTO list(@RequestParam("page") Integer page, @RequestParam("size") Integer size);
}

 实体类:

 4、在es对应的模块加入ItemClient依赖

例如:

 5、创建启动类

package com.hmall.search;import org.springframework.boot.SpringApplication;
import org.springframework.boot.autoconfigure.SpringBootApplication;
import org.springframework.cloud.openfeign.EnableFeignClients;/*** @author ning* @since 2022/12/9 20:03*///开启Feign客户端
//basePackages 指定需要扫描的包
@EnableFeignClients(basePackages = "com.hmall.client")
@SpringBootApplication
public class SearchApplication {public static void main(String[] args) {SpringApplication.run(SearchApplication.class, args);}
}

6、创建es索引库对应的实体类itemDoc

package com.hmall.search.pojo;import com.hmall.common.dto.Item;
import lombok.Data;
import lombok.NoArgsConstructor;
import org.springframework.beans.BeanUtils;import java.util.ArrayList;
import java.util.List;/*** es的实体类** @author ning* @since 2022/12/9 20:12*/@NoArgsConstructor
@Data
public class ItemDoc {private Long id;//商品idprivate String name;//商品名称private Long price;//价格(分)private String image;//商品图片private String category;//分类名称private String brand;//品牌名称private Integer sold;//销量private Integer commentCount;//评论数private Boolean isAD;//商品状态 1-正常,2-下架private List suggestion = new ArrayList<>(2);//把从数据查出来的参数复制到这个es的实体类public ItemDoc(Item item) {//复制属性BeanUtils.copyProperties(item,this);//自动补全字段//品牌suggestion.add(item.getBrand());//分类suggestion.add(item.getCategory());}
}

7、修改配置类(也可以不设置)

ribbon超时设置 (防止数据库读取时间长时,feign远程调用失败)

默认是3秒,查询如果超过3秒,就失败了

这是改成了5秒

ribbon:ConnectTimeout: 5000ReadTimeout: 5000

8、编写数据导入的测试方法

import com.alibaba.fastjson.JSON;
import com.hmall.client.ItemClient;
import com.hmall.common.dto.Item;
import com.hmall.common.dto.PageDTO;
import com.hmall.search.pojo.ItemDoc;
import lombok.extern.slf4j.Slf4j;
import org.elasticsearch.action.bulk.BulkRequest;
import org.elasticsearch.action.index.IndexRequest;
import org.elasticsearch.client.RequestOptions;
import org.elasticsearch.client.RestHighLevelClient;
import org.elasticsearch.common.xcontent.XContentType;
import org.junit.jupiter.api.Test;
import org.springframework.beans.factory.annotation.Autowired;
import org.springframework.boot.test.context.SpringBootTest;import java.io.IOException;
import java.util.List;/*** 使用分页把数据从mysql导入es** @author ning* @since 2022/12/9 20:32*/@Slf4j
@SpringBootTest
public class FeignTest {//注入远程调用分页方法的接口@Autowiredprivate ItemClient itemClient;//注入es的组件操作索引库的增删改查@Autowiredprivate RestHighLevelClient client;/*** 测试:分页接口是否正常* 建议:在正式运行下边的数据导入的代码之前,先运行以下代码,确保远程调用分页接口正常*/@Testvoid testItemClient() {PageDTO pageDTO = itemClient.list(1, 5);List itemList = pageDTO.getList();Long total = pageDTO.getTotal();log.info("total:::" + total);for (Item item : itemList) {System.out.println(item);}}/*** 数据导入(从mysql导入es)*/@Testvoid testDataSync() {//使用分页查询数据库//(当前页和每页显示几条数据可以随便写,目的是获取总记录数)PageDTO pageDTO = itemClient.list(1, 1);//获取总记录数Long total = pageDTO.getTotal();System.out.println("total:" + total);//设置每页有1000条数据int size = 1000;//计算页数//总记录数和1000做模运算,如果为0,总页数就是total / size的值,否则就是total / size + 1Long page = total % size == 0 ? total / size : total / size + 1;//根据页数循环,把每一页的数据复制到esfor (int i = 1; i <= page; i++) {//使用分页方法获取每页的数据pageDTO = itemClient.list(i, size);//创建一个批量请求BulkRequest bulkRequest = new BulkRequest();for (Item item : pageDTO.getList()) {//判断商品的状态,只有是可售卖的状态才可以复制到esif (item.getStatus() == 1) {//创建es的实体类对象,并赋值数据库查出当页数据赋值ItemDoc itemDoc = new ItemDoc(item);//把封装之后的es的实体类对象转成json格式String jsonString = JSON.toJSONString(itemDoc);//System.out.println(itemDoc.getId());//生成添加文档的请求bulkRequest.add(                    //并把添加文档的请求存入批量请求中new IndexRequest("item")    //创建一个添加文档的请求对象,item为添加到哪个索引库.id(itemDoc.getId().toString())//新添加数据的id.source(jsonString, XContentType.JSON)//添加的数据,声明数据格式是json);}}try {//发送请求//第一个参数:创建的请求,第二个参数:是否还有其他执行的选项,一般选DEFAULTclient.bulk(bulkRequest, RequestOptions.DEFAULT);System.out.printf("第%d页,本页总条数:%d,导入完毕\r\n", i, pageDTO.getList().size());} catch (IOException e) {e.printStackTrace();}}}
}

我出现的问题:

以上步骤执行完毕之后,我的代码报了一个错:

 

 意思是,拒绝连接:没有进一步的信息

我的解决方案是:在yml文件中配置以下信息,问题就可以解决

spring:data:elasticsearch:repositories:enabled: true# 异常处理elasticsearch:rest:uris: 192.168.177.132:9200

但是,我水品有限,没有明白什么原因,还有这个配置文件中的内容也不是很清楚,如果有路过的大佬,原因耽误宝贵的时间,给小弟解释一下,小弟不胜感激!!!!

相关内容

热门资讯

【MySQL】锁 锁 文章目录锁全局锁表级锁表锁元数据锁(MDL)意向锁AUTO-INC锁...
【内网安全】 隧道搭建穿透上线... 文章目录内网穿透-Ngrok-入门-上线1、服务端配置:2、客户端连接服务端ÿ...
GCN的几种模型复现笔记 引言 本篇笔记紧接上文,主要是上一篇看写了快2w字,再去接入代码感觉有点...
数据分页展示逻辑 import java.util.Arrays;import java.util.List;impo...
Redis为什么选择单线程?R... 目录专栏导读一、Redis版本迭代二、Redis4.0之前为什么一直采用单线程?三、R...
【已解决】ERROR: Cou... 正确指令: pip install pyyaml
关于测试,我发现了哪些新大陆 关于测试 平常也只是听说过一些关于测试的术语,但并没有使用过测试工具。偶然看到编程老师...
Lock 接口解读 前置知识点Synchronized synchronized 是 Java 中的关键字,...
Win7 专业版安装中文包、汉... 参考资料:http://www.metsky.com/archives/350.htm...
3 ROS1通讯编程提高(1) 3 ROS1通讯编程提高3.1 使用VS Code编译ROS13.1.1 VS Code的安装和配置...
大模型未来趋势 大模型是人工智能领域的重要发展趋势之一,未来有着广阔的应用前景和发展空间。以下是大模型未来的趋势和展...
python实战应用讲解-【n... 目录 如何在Python中计算残余的平方和 方法1:使用其Base公式 方法2:使用statsmod...
学习u-boot 需要了解的m... 一、常用函数 1. origin 函数 origin 函数的返回值就是变量来源。使用格式如下...
常用python爬虫库介绍与简... 通用 urllib -网络库(stdlib)。 requests -网络库。 grab – 网络库&...
药品批准文号查询|药融云-中国... 药品批文是国家食品药品监督管理局(NMPA)对药品的审评和批准的证明文件...
【2023-03-22】SRS... 【2023-03-22】SRS推流搭配FFmpeg实现目标检测 说明: 外侧测试使用SRS播放器测...
有限元三角形单元的等效节点力 文章目录前言一、重新复习一下有限元三角形单元的理论1、三角形单元的形函数(Nÿ...
初级算法-哈希表 主要记录算法和数据结构学习笔记,新的一年更上一层楼! 初级算法-哈希表...
进程间通信【Linux】 1. 进程间通信 1.1 什么是进程间通信 在 Linux 系统中,进程间通信...
【Docker】P3 Dock... Docker数据卷、宿主机与挂载数据卷的概念及作用挂载宿主机配置数据卷挂载操作示例一个容器挂载多个目...