AI-StubbornHuang Blog

感谢大家访问本站，希望本站的内容可以帮助到大家！
如果觉得本站的内容有帮助，可以考虑打赏博主哦！
本站由于前段时间遭受到大量临时和国外邮箱注册，所以对可注册的邮箱类型进行了限制！
问题反馈可发送邮件到stubbornhuang@qq.com
在本站开通年度VIP，无限制下载本站资源和阅读本站文章
工资「喂饱肚子」，副业「养活灵魂」！
欢迎大家交换友链，可在https://www.stubbornhuang.com/申请友情链接进行友链交换申请！
计算机图形学与计算几何经典必备书单整理，下载链接可参考：https://www.stubbornhuang.com/1256/
本站会放置Google广告用于维持域名以及网站服务器费用。

大模型推理为什么慢？从 Prefill、Decode 到 KV Cache，一文讲透推理加速全流程

大模型推理慢，很多时候并不是因为部署模型的GPU算力不够强，也不是因为模型本身参数太大，结构复杂算不动。真正的问题在于大模型生成文本不是一次性算出完整答案，而是一个自回归生成token的过程，一个Token一个Token的往外吐，而且每一步都要访问越来越长的上下文和 KV Cache。我们在前端…

StubbornHuang
AI
2026-06-01
270
1

避坑指南 – 解决PaddleOCR-VL在GPU上随机概率出现模型推理假死问题

1 PaddleOCR-VL在GPU上随机出现推理假死问题之前在一个自己的一个算法管线里面加入了PaddleOCR-VL用于文字识别，我的数据是一连串的图片。今天突然发现提交的一个任务在PaddleOCR-VL模型调用predict方法推理的时候会卡在那里，既没有爆显存，python也没有捕捉到…

StubbornHuang
模型部署
2026-04-17
551
0

KV Cache是什么？为什么会有KV Cache?

在以Transformer架构的模型推理阶段，KV Cache是一种为了大幅提升大语言模型(LLM)生成速度而采用的关键技术，核心目标是：避免在生成一个新的Token时，重复计算之前已经生成过的Token的注意力信息。 1 KV Cache是什么？在Transformer模型中，注意力机制的核心公…

StubbornHuang
面试题
2026-04-07
424
0

PagedAttention是什么？

PagedAttention是vLLM团队提出的一种内存管理机制，它借鉴了现代操作系统中虚拟内存(Virtual Memory)和分页(Paging)的设计思想。 1 为什么需要PagedAttention? 在传统的KV Cache实现中，我们通常需要预先为每个序列分配一块连续的显存空间，其大小通…

StubbornHuang
面试题
2026-04-07
426
0

RLHF: Reinforcement Learning from Human Feedback 基于人类反馈的强化学习

本文翻译自：https://huyenchip.com/2023/05/02/rlhf.html , 由Chip Huyen在2023年3月2日发表于https://huyenchip.com/ 在探讨 ChatGPT 为何能如此吸引我们想象力的文献中，我经常遇到两种说法： 1. 规模：投入更多的数…

StubbornHuang
AI
2026-01-07
1,175
0

快速部署Python+PyTorch AI模型推理服务的Docker方法

一个AI模型需要快速上线验证时，前期可以不考虑模型加速和并发的问题，直接基于python+pytorch+cuda（cpu）的方式打成docker,包成推理http服务上线。打成docker有两种方式： 1. 基于NVIDIA的官方CUDA版本的docker镜像，逐步安装python、pytorc…

StubbornHuang
模型部署
2025-06-10
1,935
0

Basicsr增加计算lpips评测指标

lpips是图像超分中的重要评测指标，但是在BasicSR中没有实现，本文将分享如何在BasicSR中增加lpips评测指标。 1 安装lpips和BasicSR 首先安装lpips pip install lpips 然后安装BasicSR pip install basicsr 2 在Basic…

StubbornHuang
图片超分
2025-04-08
5,683
0

修改basicsr模型训练的流程，在模型训练和微调之前就验证一遍数据集

1 修改basicsr模型训练的流程，在模型第一次训练之前就验证一遍数据集找到basicsr的basicsr/train.py文件，如果是以包的方式安装的basicsr，就在你的conda环境中找到basicsr的包所在位置，然后再找到basicsr/train.py文件。一般在conda虚拟环…

StubbornHuang
图片超分
2025-03-28
5,167
0

修改basicsr模型训练时的loss打印输出形式，从科学计数修改为小数点形式

1 修改basicsr模型训练时的loss打印输出形式，从科学计数修改为小数点形式找到basicsr的basicsr/utils/logger.py文件，如果是以包的方式安装的basicsr，就在你的conda环境中找到basicsr的包所在位置，然后再找到basicsr/utils/logger…

StubbornHuang
图片超分
2025-03-28
4,672
0

图片超分和视频超分数据集整理

在图像超分和视频超分领域中，数据集至关重要。本文旨在概述流行的开源图像超分和视频超分数据集，为正在做超分的同学提供数据集思路。 1 图像超分辨率数据集 1.1 DIV2K数据集 DIV2K数据集是用于图像超分辨率最流行的数据集之一，是为 NTIRE2017 和 NTIRE2018 超分辨率挑战赛收集…

StubbornHuang
图片超分
2025-03-26
6,280
0

BasicSR 模型训练和模型测试配置文件配置信息详细说明

1 BasicSR训练配置文件各配置项详细说明本文内容来源于BasicSR-docs ，这里只做摘抄，这个仓库对BasicSR目录层次，代码结构、文件配置的详细说明文档，如果你正在学习和了解BasicSR，我推荐可以先详细阅读这个文档。 1.1 通用配置 # general settings - …

StubbornHuang
图片超分
2025-03-25
5,726
0

使用自定义LR-HR pair对数据集微调Real-ESRGAN 1x 1倍超分模型

1 什么场景下我们会需要Real-ESRGAN 1x 1倍超分模型？一提到超分，想到的肯定是将输入图片放大2倍、4倍、8倍、甚至16倍，那么为什么会有图像超分1倍这种需求呢？比如一张输入图片，分辨率为1920x1082，然后图片超分1倍，依然输出一张1920x1080分辨率的图片。在大多数人看起…

StubbornHuang
图片超分
2025-03-20
4,946
0

联系我

资助我们