古法编程之手写爬虫框架01-基础架构

受到 scrapy 框架启发,本系列要实现一个异步高并发的爬虫框架,记录一下手写的过程,在 AI 横行的时代,停下来审视自己架构、高并发的基本功,我觉得是挺有意

AIAgent工作经历复盘

这个系列文章主要是复盘、总结、重新审视我在AIAgent领域的工作经历,从在完美世界做的游戏内个性化 NPC,以及鹅厂不算完美的代码生成平台,

BFF层服务的前端工程化

这个系列是基于在鹅厂的工程实践,抽象出来的MVP版本实践。 本文就是为了BFF层设计的前端基建内容,在做前端基建之前,还是要再次复习一下我们之

BFF的服务端设计

号外:发现hono.js是个神器呀,配合上 cloudflare,再加上 AI 时代的需要,又能跨平台、性能还猛…… 这个系列是基于在鹅厂的工程实践,

RAG设计之PDF解析器优化

本文主题是 pdf 解析器,是离线解析文档的入口,也是比较难的一部分,因为 PDF 里面的内容比较复杂,需要考虑很多细节。 例如:表格数据(尤以多个表格排布最难)、图片、页脚引用等等。本文使用到的资料均已脱敏,不涉及到任何公司隐私,仅做个人复盘。