File size: 2,264 Bytes
3532965
886e0ff
 
 
 
3532965
886e0ff
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
---
license: gpl-3.0
language:
- en
- zh
---


# ChatLaw-13B

- Github: [ChatLaw](https://github.com/JessyTsu1/ChatLaw)

此版本为学术demo版,基于姜子牙[Ziya-LLaMA-13B-v1](https://huggingface.co/IDEA-CCNL/Ziya-LLaMA-13B-v1)训练而来(LLaMA权重的许可证限制,我们无法直接发布完整的模型权重,用户需自行合并)


# ChatLaw系列模型

- [ChatLaw-33B](https://huggingface.co/JessyTsu1/ChatLaw-33B)
- [Law Text2Vec](https://huggingface.co/chestnutlzj/law-sentence-similarity-roberta-base)


## 简介 Brief Introduction

ChatLaw法律大模型目前开源的仅供学术参考的版本为姜子牙-13B版本、Anima-33B版本,我们使用大量法律新闻、法律论坛、法条、司法解释、法律咨询、法考题、判决文书等原始文本来构造对话数据。

基于姜子牙-13B的模型是第一版模型,得益于姜子牙的优秀中文能力和我们对数据清洗、数据增强过程的严格要求,我们在逻辑简单的法律任务上表现优异,但涉及到复杂逻辑的法律推理任务时往往表现不佳。

随后基于[Anima-33B](https://github.com/lyogavin/Anima),我们增加了训练数据,做成了ChatLaw-33B,发现逻辑推理能力大幅提升,由此可见,大参数的中文LLM是至关重要的。

基于可商用的模型训练而成的版本会作为我们产品[ChatLaw](http://www.chatlaw.cloud/)内部接入的版本,对外不开源。


## 效果 Results

![](https://raw.githubusercontent.com/JessyTsu1/ChatLaw/master/demo/demo_3.jpg)

![](https://raw.githubusercontent.com/JessyTsu1/ChatLaw/master/demo/demo_1.jpg)![](https://raw.githubusercontent.com/JessyTsu1/ChatLaw/master/demo/demo_2.jpg)


##  使用 Usage

由于LLaMA权重的许可限制,该模型不能用于商业用途,请严格遵守LLaMA的使用政策。考虑到LLaMA权重的许可证限制,我们无法直接发布完整的模型权重。、


欢迎引用我们的[网站](https://github.com/JessyTsu1/ChatLaw):

```
@misc{ChatLaw,
  author={Jiaxi Cui and Zongjian Li and Yang Yan and Bohua Chen and Li Yuan},
  title={ChatLaw},
  year={2023},
  publisher={GitHub},
  journal={GitHub repository},
  howpublished={\url{https://github.com/JessyTsu1/ChatLaw}},
}
```