Chinaunix首页 | 论坛 | 博客
  • 博客访问: 7735759
  • 博文数量: 1776
  • 博客积分: 18684
  • 博客等级: 上将
  • 技术积分: 16402
  • 用 户 组: 普通用户
  • 注册时间: 2010-06-02 10:28
个人简介

啥也没写

文章分类

全部博文(1776)

文章存档

2025年(6)

2024年(16)

2023年(44)

2022年(39)

2021年(46)

2020年(43)

2019年(27)

2018年(44)

2017年(50)

2016年(47)

2015年(15)

2014年(21)

2013年(43)

2012年(143)

2011年(228)

2010年(263)

2009年(384)

2008年(246)

2007年(30)

2006年(38)

2005年(2)

2004年(1)

分类: 系统运维

2025-02-21 10:01:46

安装
git clone https :/ / github.com/AutoGPTQ/AutoGPTQ
cd AutoGPTQ
pip install -vvv --no-build-isolation -e .

代码:


点击(此处)折叠或打开

  1. from auto_gptq import AutoGPTQForCausalLM, BaseQuantizeConfig
  2. from transformers import AutoTokenizer

  3. # Specify paths and hyperparameters for quantization
  4. model_path = "/data/qwen3b/Qwen/Qwen2___5-3B-Instruct/"
  5. quant_path = "/data/qwen3b/Qwen/Qwen2___5-3B-Instruct-4bit-gptq/"
  6. quantize_config = BaseQuantizeConfig(
  7.     bits=4, # 4 or 8
  8.     group_size=128,
  9.     damp_percent=0.01,
  10.     desc_act=False, # set to False can significantly speed up inference but the perplexity may slightly bad
  11.     static_groups=False,
  12.     sym=True,
  13.     true_sequential=True,
  14.     model_name_or_path=None,
  15.     model_file_base_name="model"
  16. )
  17. max_len = 8192

  18. # Load your tokenizer and model with AutoGPTQ
  19. # To learn about loading model to multiple GPUs,
  20. # visit https://github.com/AutoGPTQ/AutoGPTQ/blob/main/docs/tutorial/02-Advanced-Model-Loading-and-Best-Practice.md
  21. tokenizer = AutoTokenizer.from_pretrained(model_path)
  22. model = AutoGPTQForCausalLM.from_pretrained(model_path, quantize_config)

  23. examples = [
  24.     tokenizer(
  25.         "Auto-GPTQ 是一个简单易用的模型量化库,基于 GPTQ 算法,具有用户友好的 API。"
  26.     )
  27. ]
  28. #model.quantize(examples)
  29. model.quantize(examples, cache_examples_on_gpu=False)
  30. model.save_quantized(quant_path, use_safetensors=True)
  31. tokenizer.save_pretrained(quant_path)





阅读(30) | 评论(0) | 转发(0) |
0

上一篇:ssh over socks5代理

下一篇:没有了

给主人留下些什么吧!~~