文章列表

RAG 固定大小分块有什么问题?

RAG 固定大小分块有什么问题?

本文深入剖析RAG中固定大小分块的核心缺陷——语义断裂、主题打散、结构无感,通过图示与案例展示其对检索精度和生成质量的负面影响,对比递归字符分块、语义分块等替代方案,并提供Overlap设置与元数据增强等生产级优化实践,是RAG系统调优的实战参考。


犬小哈2026/6/3Java面试八股文
RAG 中你是怎么做分块的?块大小怎么选的?

RAG 中你是怎么做分块的?块大小怎么选的?

本文深入解析RAG系统中的文本分块策略与块大小调优方法,详细对比固定大小切分、递归字符分块、按段落/句子分块等方案的适用场景,剖析块过大或过小对检索精度的影响,并提供基于场景的初始值设定与实验验证三步法,是RAG工程落地的实战指南。


犬小哈2026/6/3Java面试八股文
Embedding 是什么?1536 维什么意思?

Embedding 是什么?1536 维什么意思?

本文深入解析Embedding(向量嵌入)的核心概念,从文本到向量的转换过程、1536维度的含义到余弦相似度计算,逐层拆解语义检索的底层原理。通过Spring AI代码示例对比不同Embedding模型的选型考量,帮助开发者理解RAG检索环节的技术本质。


犬小哈2026/6/2Java面试八股文
为什么 RAG 要用向量数据库?其他数据库不行吗?

为什么 RAG 要用向量数据库?其他数据库不行吗?

本文深入解析RAG为什么必须使用向量数据库的核心原因——语义检索而非关键词匹配,对比向量数据库与MySQL、Elasticsearch在检索方式上的本质差异,剖析HNSW索引、余弦相似度等关键技术,并给出Milvus、PGVector、Elasticsearch的选型建议与Spring AI集成示例,是理解RAG检索环节选型的必备指南。


犬小哈2026/6/2Java面试八股文
RAG 的完整流程是什么?

RAG 的完整流程是什么?

本文深入拆解RAG(检索增强生成)的完整流程,从离线阶段的文档解析、文本切分、向量化入库,到在线阶段的向量检索、Hybrid Search、Rerank重排序、LLM生成,详解每个环节的关键技术决策与最佳实践,并给出Spring AI与LangChain4j的完整代码示例,是构建RAG系统的实战指南。


犬小哈2026/6/2Java面试八股文
什么是 RAG?为什么需要 RAG?

什么是 RAG?为什么需要 RAG?

本文深入解析RAG(检索增强生成)的核心原理与技术架构,从大模型的幻觉、知识截止、领域缺失等痛点出发,详细对比RAG、微调与长上下文的优劣与选型,并展望Agentic RAG等前沿演进,帮助开发者全面理解这一大模型应用的关键技术。


犬小哈2026/6/1Java面试八股文
什么是 Dubbo 的优雅停机,怎么实现的?

什么是 Dubbo 的优雅停机,怎么实现的?

本文深入解析Dubbo优雅停机的实现原理,详细阐述从注册中心注销、关闭Server拒绝新请求到等待已有请求完成的三步核心流程,并结合JVM ShutdownHook机制与K8s部署场景,帮助开发者理解如何实现服务无损上下线。


犬小哈2026/5/27Java面试八股文
Dubbo 的服务调用过程是什么样的?

Dubbo 的服务调用过程是什么样的?

本文深入剖析 Dubbo 一次完整的服务调用过程,从消费者端的动态代理、Filter 链、Cluster 集群容错、LoadBalance 负载均衡,到提供者端的解码、反射调用与结果返回,详细图解 10 步核心链路,帮助开发者彻底理解 Dubbo RPC 的底层运行机制。


犬小哈2026/5/27Java面试八股文