Chinaunix首页 | 论坛 | 博客
  • 博客访问: 7736285
  • 博文数量: 1776
  • 博客积分: 18684
  • 博客等级: 上将
  • 技术积分: 16402
  • 用 户 组: 普通用户
  • 注册时间: 2010-06-02 10:28
个人简介

啥也没写

文章分类

全部博文(1776)

文章存档

2025年(6)

2024年(16)

2023年(44)

2022年(39)

2021年(46)

2020年(43)

2019年(27)

2018年(44)

2017年(50)

2016年(47)

2015年(15)

2014年(21)

2013年(43)

2012年(143)

2011年(228)

2010年(263)

2009年(384)

2008年(246)

2007年(30)

2006年(38)

2005年(2)

2004年(1)

分类: 系统运维

2025-02-21 10:04:14

安装
git clone https :/ / github.com/casper-hansen/AutoAWQ
cd AutoAWQ
pip install -vvv --no-build-isolation -e .

代码:

点击(此处)折叠或打开

  1. from datasets import load_dataset
  2. from awq import AutoAWQForCausalLM
  3. from transformers import AutoTokenizer

  4. # Specify paths and hyperparameters for quantization
  5. model_path = "/data/qwen3b/Qwen/Qwen2___5-3B-Instruct/"
  6. quant_path = "/data/qwen3b/Qwen/Qwen2___5-3B-Instruct-AWQ/"
  7. quant_config = { "zero_point": True, "q_group_size": 128, "w_bit": 4, "version": "GEMM" }

  8. # Load model
  9. model = AutoAWQForCausalLM.from_pretrained(model_path)
  10. tokenizer = AutoTokenizer.from_pretrained(model_path, trust_remote_code=True)

  11. # Define data loading methods
  12. def load_dolly():
  13.     data = load_dataset('databricks/databricks-dolly-15k', split="train")

  14.     # concatenate data
  15.     def concatenate_data(x):
  16.         return {"text": x['instruction'] + '\n' + x['context'] + '\n' + x['response']}

  17.     concatenated = data.map(concatenate_data)
  18.     return [text for text in concatenated["text"]]

  19. def load_wikitext():
  20.     data = load_dataset('wikitext', 'wikitext-2-raw-v1', split="train")
  21.     return [text for text in data["text"] if text.strip() != '' and len(text.split(' ')) > 20]

  22. # Quantize
  23. model.quantize(tokenizer, quant_config=quant_config, calib_data=load_wikitext())

  24. # Save quantized model
  25. model.save_quantized(quant_path)
  26. tokenizer.save_pretrained(quant_path)

  27. print(f'Model is quantized and saved at "{quant_path}"')
运行:
export HF_ENDPOINT=https :// hf-mirror.com
python 1.py





阅读(35) | 评论(0) | 转发(0) |
0

上一篇:ssh over socks5代理

下一篇:没有了

给主人留下些什么吧!~~