文章列表

RAG vs 微调 vs 提示工程,什么时候用哪个?

RAG vs 微调 vs 提示工程,什么时候用哪个?

本文深入对比RAG、微调和提示工程三种大模型应用方案的本质差异,从知识来源、更新成本、适用场景等维度建立完整决策框架,结合Spring AI代码示例剖析三者组合使用的实战模式,并探讨CAG、Agentic RAG、LoRA微调等2025-2026年最新趋势,是LLM架构选型的权威指南。


犬小哈2026/6/6Java面试八股文
Dubbo 支持哪些负载均衡策略?

Dubbo 支持哪些负载均衡策略?

本文深入解析Dubbo内置的五种负载均衡策略:加权随机(Random)、平滑加权轮询(RoundRobin)、最少活跃数(LeastActive)、一致性哈希(ConsistentHash)及最短响应时间(ShortestResponse),从源码原理、算法图解到生产场景选型,完整对比各策略的优劣,并给出方法级、服务级、全局配置示例,是微服务调用治理的必读指南。


犬小哈2026/6/6Java面试八股文
Dubbo 支持哪些序列化方式?

Dubbo 支持哪些序列化方式?

本文深入解析Dubbo支持的Hessian2、Kryo、FST、Protobuf等序列化方式的原理与性能差异,从速度、体积、跨语言能力等维度进行对比,剖析Dubbo 2.x默认Hessian2与Dubbo 3.x推荐Triple+Protobuf的演进原因,并结合SPI扩展机制与Kryo类注册优化,提供序列化选型实战指南。


犬小哈2026/6/6Java面试八股文
RAG 固定大小分块有什么问题?

RAG 固定大小分块有什么问题?

本文深入剖析RAG中固定大小分块的核心缺陷——语义断裂、主题打散、结构无感,通过图示与案例展示其对检索精度和生成质量的负面影响,对比递归字符分块、语义分块等替代方案,并提供Overlap设置与元数据增强等生产级优化实践,是RAG系统调优的实战参考。


犬小哈2026/6/3Java面试八股文
RAG 中你是怎么做分块的?块大小怎么选的?

RAG 中你是怎么做分块的?块大小怎么选的?

本文深入解析RAG系统中的文本分块策略与块大小调优方法,详细对比固定大小切分、递归字符分块、按段落/句子分块等方案的适用场景,剖析块过大或过小对检索精度的影响,并提供基于场景的初始值设定与实验验证三步法,是RAG工程落地的实战指南。


犬小哈2026/6/3Java面试八股文
Embedding 是什么?1536 维什么意思?

Embedding 是什么?1536 维什么意思?

本文深入解析Embedding(向量嵌入)的核心概念,从文本到向量的转换过程、1536维度的含义到余弦相似度计算,逐层拆解语义检索的底层原理。通过Spring AI代码示例对比不同Embedding模型的选型考量,帮助开发者理解RAG检索环节的技术本质。


犬小哈2026/6/2Java面试八股文