RAG 的探索与实践

AI 

一、背景介绍 大模型在应用落地上存在的主要问题包括: 幻觉问题:大模型在没有答案的情况下提供虚假信息。 新鲜度问题:由于模型知识更新较慢、周期较长、成本问题等导致模型内容不够新鲜。 数据安全与隐私问题:数据存在泄露和滥用等风险。 为解决上述问题,RAG 应运而生。 RAG,即检索增强生成(Retri

http优化


耗时分析 因为有“队头阻塞”,浏览器对每个域名最多开 6 个并发连接(HTTP/1.1),当页面里链接很多的时候就必须排队等待(Queued、Queueing),这里它就等待了 1.62 秒,然后才被浏览器正式处理; 浏览器要预先分配资源,调度连接,花费了 11.56 毫秒(Stalled); 连接

WebSocket


为什么要有 WebSocket “WebSocket”是一种基于 TCP 的轻量级网络通信协议,在地位上是与 HTTP“平级”的。 其实 WebSocket 与 HTTP/2 一样,都是为了解决 HTTP 某方面的缺陷而诞生的。HTTP/2 针对的是“队头阻塞”,而 WebSocket 针对的是“请

CDN加速


为什么要有网络加速? 光速是有限的,虽然每秒 30 万公里,但这只是真空中的上限,在实际的电缆、光缆中的速度会下降到原本的三分之二左右,也就是 20 万公里 / 秒,这样一来,地理位置的距离导致的传输延迟就会变得比较明显了。 比如,北京到广州直线距离大约是 2000 公里,按照刚才的 20 万公里

Nginx


Nginx 作为“轻量级”的服务器,使用了“进程池 + 单线程”的工作模式。 Nginx 在启动的时候会预先创建好固定数量的 worker 进程,在之后的运行过程中不会再 fork 出新进程,这就是进程池,而且可以自动把进程“绑定”到独立的 CPU 上,这样就完全消除了进程创建和切换的成本,能够充分

HTTP/2/3


由于 HTTPS 已经在安全方面做的非常好了,所以 HTTP/2 的唯一目标就是改进性能。 头部压缩 HTTP/1 里可以用头字段“Content-Encoding”指定 Body 的编码方式,比如用 gzip 压缩来节约带宽,但报文的另一个组成部分——Header 却被无视了,没有针对它的优化手段

加密协议


对称加密与非对称加密 实现机密性最常用的手段是“加密”(encrypt),就是把消息用某种方式转换成谁也看不懂的乱码,只有掌握特殊“钥匙”的人才能再转换出原始文本。 这里的“钥匙”就叫做“密钥”(key),加密前的消息叫“明文”(plain text/clear text),加密后的乱码叫“密文”(

网络协议


HTTP 是一个协议。 为什么需要协议? 如果只有你一个人,那你自然可以想干什么就干什么,想怎么玩就怎么玩,不会干涉其他人,其他人也不会干涉你,也就不需要所谓的“协议”。但是,一旦有了两个以上的参与者出现,为了保证最基本的顺畅交流,协议就自然而然地出现了。 HTTP 是一个用在计算机世界里的协议。它

慢SQL优化思路


1.慢SQL优化思路 慢查询日志记录慢SQL explain分析SQL的执行计划 profile 分析执行耗时 Optimizer Trace分析详情 确定问题并采用相应的措施 1.1 慢查询日志记录慢SQL 如何定位慢SQL呢、我们可以通过**慢查询日志**来查看慢SQL。默认的情况下呢,MySQ

decimal和double底层存储区别

MySQL 

1. DECIMAL 类型 特点: 精确存储:DECIMAL 类型用于存储精确的定点数,适合存储需要精度的财务、货币等数据。 存储方式:通常以字符串或压缩的二进制表示存储。 精度和标度:用户可以指定总的数字位数(precision)和小数位数(scale)。 例如,DECIMAL(10, 2) 表示