归档
民胞物与,念兹在兹
03
04
wsl与clash代理 wsl与clash代理
这几天重置了网络配置,导致WSL的网络代理出了问题,这里记录一下。 配置与问题表现软件环境:WSL2+Clash代理 WSL代理配置:在wsl的~/.zshrc文件中配置如下: export hostip=$(cat /
2025-03-04
02
02
RAG与长上下文之争 RAG与长上下文之争
源于 RAG 系统自身“易用难精”的调优挑战,RAG实际应用效果面临诸多质疑。然而,一个颇具意味的现象是,尽管争议增多且并非处于流量中心,但真正致力于构建核心竞争力、严肃对待 AI 能力建设的企业,尤其是中大型组织,对 RAG 的投入反而更为深入和系统化。RAG 在企业 AI 架构中非但未被边缘化,反而更加稳固地扮演着核心角色,其作为关键基础设施的地位并未动摇。
2025-02-02
12
24
RAG(检索增强生成) RAG(检索增强生成)
2024 年以“Retrieval Augmented Generation”为关键词的论文超过了一千篇,相比2023年增长了近10倍。这种指数级增长背后,是 RAG 从学术概念快速演进为企业级 AI 落地的核心技术范式。三年前,RAG 还只是解决大模型幻觉问题的辅助手段;今天,它已经成长为连接 LLM 能力与行业知识需求的桥梁。
2024-12-24
09
13
Flask、SQLAlchemy和Migrate Flask、SQLAlchemy和Migrate
flask-sql_alchemy和flask-migrate在 Flask + 数据库 体系里几乎是“标配搭子”,如果把开发 Web 应用比作盖房子,那么 SQLAlchemy 就是施工图纸和建筑材料,而 Flask-Migrate 就是装修进度管理手册。
2024-09-13
08
28
LLM中的Tokenizer LLM中的Tokenizer
在现代计算语言学和大规模语言模型(LLM)的架构体系中,分词器(Tokenizer)是连接人类自然语言与机器数值计算的唯一底层接口。
2024-08-28
06
20
redis简介 redis简介
Redis(全称为Remote Dictionary Server)是一个开源的高性能键值对存储系统,具有快速、灵活和可扩展的特性。它是一个基于内存的数据结构存储系统,可以用作数据库、缓存和消息代理。
2024-06-20
04
21
uv教程 uv教程
作为Astral团队推出的下一代Python工具链,uv凭借Rust底层架构和极致性能,正在重构全球数百万开发者的工作流。本文将从零开始详解uv的核心语法、进阶技巧.
2024-04-21
19
Python包管理工具深度解析:venv、conda、poetry与uv Python包管理工具深度解析:venv、conda、poetry与uv
在Python开发中,包管理工具的选择直接影响项目的可维护性、依赖隔离和协作效率。本文将从核心功能、适用场景、操作实践等角度,全面解析四大主流工具:**venv**、**conda**、**poetry**和**uv**,并对比其优缺点,助你找到最适合项目的解决方案。
2024-04-19
04
09
02
15
python多进程中的坑 python多进程中的坑
线上环境docker容器中使用python多进程开发时遇到另一个小坑,做一下记录。问题表现为docker容器卡死,不执行程序并且也不再消费消息队列中的任务。
2022-02-15
12
11
Don't stop pretraining Don't stop pretraining
如今很多NLP任务都会在Bert等预训练模型的基础上进行fine-tuning,可能很多人没有意识到在任务领域上进行新的预训练会进一步提高模型效果,下面这篇论文就从多个实践角度证明了这种方法的可行性。
2021-12-11
11
01
NER技术的探索与实践 NER技术的探索与实践
命名实体识别(Named Entity Recognition,简称NER),是指识别文本中具有特定意义的实体,主要包括人名、地名、机构名、专有名词等,一般的也可以识别特定类型的、人为规定的实体。
2021-11-01
08
06
神经网络语言模型 神经网络语言模型
语言模型本质是计算给定序列的概率,而神经网络强大的非线性拟合能力很适合拟合概率分布。并且神经网络模型可以获取到当前词汇下文的信息,这一点是N-gram语言模型所不具备的,另外神经网络模型能够利用到的的上下文词汇长度要比N-gram模型长的多。
2021-08-06
05
26
语言模型——N-gram模型 语言模型——N-gram模型
N-gram模型是一种基于马尔科夫假设的语言模型,即当前词出现的可能性大小只与这个单词前面一个或者几个单词有关,而与这几个单词之外的其他单词无关。
2021-05-26
03
04
02
python协程入门 python协程入门
python并发编程中的协程。协程,又称微线程,英文名Coroutine,是运行在单线程中的“并发”,协程相比多线程的一大优势就是省去了多线程之间的切换开销,获得了更高的运行效率。
2021-04-02
03
10
01
01
1 / 3