干货精选
Claude 3.5 Sonnet 深度测评:编程能力全面超越 GPT-4


Claude 3.5 Sonnet 深度测评:编程能力全面超越 GPT-4 引言 Anthropic 在 2024 年发布的 Claude 3.5 Sonnet 在多项基准测试中表现出色,特别是在编程和推理任务上展现出惊人的能力。本文将从多个维度进行深度测评。 核心能力对比 编程能力 | 测试项 |...
检索策略与重排序算法
检索策略怎么选? 今天被问到这个问题,简单回答一下。 纯语义检索 就是用 Embedding 向量相似度搜索。 优点:理解语义,"苹果手机" 能匹配 "iPhone"。 缺点:精确匹配不行,搜 "iPhone 15" 可能返回 "iPhone 14"。 纯关键词检索 传统的 BM25 算法。 优点:...
Prompt工程与答案生成
RAG Prompt 模板分享 RAG 的 Prompt 写法和普通对话不一样,这里分享几个我常用的模板。 模板一:基础问答 模板二:带引用 模板三:结构化输出 小技巧 明确告诉模型「不知道就说不知道」 限制回答长度 要求引用来源 这几个模板够用了,别搞太复杂。