TriadParty
/

deepmoney-34b-200k-base

@@ -38,4 +38,22 @@ Finally, I made a blend of the data. General data is not included because it is
 Raw text, full parameter training. The base uses long context yi-34b-200k. This is necessary to complete and understand an in-depth report.
-Of course, I also did a sft. [This](https://huggingface.co/TriadParty/deepmoney-34b-200k-chat-evaluator) is the analyzer in my process – I haven’t broken down the qualitative and quantitative analysis yet, but I’m already blown away by how well it works.

 Raw text, full parameter training. The base uses long context yi-34b-200k. This is necessary to complete and understand an in-depth report.
+Of course, I also did a sft. [This](https://huggingface.co/TriadParty/deepmoney-34b-200k-chat-evaluator) is the analyzer in my process – I haven’t broken down the qualitative and quantitative analysis yet, but I’m already blown away by how well it works.
+### 1. 我想干什么？
+当下大多数所谓的金融模型大多在公开知识上进行训练，但在实际的金融领域，这些公开知识对当前的市场可解释性往往严重不足。如果您感兴趣，可以了解一下凯恩斯、弗里德曼乃至当下行为金融学的各类主张。而据我观察，大多数金融模型无法对投资进行判断。因为它们都是在普通的教材、入门的分析师考试，乃至公司的公开报告上训练。我认为这对于投资的价值非常小。
+你可以当我开玩笑，但事实是很多主观分析师的逻辑性可能还不如34b及以上的大模型来的严谨（当然不包括那些优秀的）。而每时每刻，市场都在变化，大量的新闻，海量的数据都是实时的，对于大多数散户们，与其等待蹩脚的分析师写出报告，为什么不用大模型制作一套pipeline呢？
+在我的计划中，该模型是这套流程的基座模型，在我的计划中，信息搜集者、标的判断者、定性分析者定性分析者、定量分析者、数据提取者等模型都是该流程的一部分。但模型本身掌握大量的定性和定量方法毫无疑问是重要的。这就是这个模型诞生的理由。
+### 2. 关于数据：
+正如我刚才所说，很多公开知识的有效性都有些问题——但这并不意味着它们是错误的。在研报中很多研究方法背后的理论支撑也依赖这些知识。所以在我的训练中，我挑选了一些大学教材和一些专业书籍。数量不是很多但质量还不错。另外，我挑选了在2019-2023年12月的大量研究报告数据——这些报告的发布者多种多样，有传统的broke，也有专业研究机构。他们中的大多数是付费的，而且只对机构提供。但无论如何我通过各种各样的手段获取了它们。
+如果你看过研报，尤其是高质量的那些，你会发现研报都是主观判断+定量分析，而定量分析中的数据支撑对于整个逻辑链条至关重要。为了提取这些数据（他们中的大多数以图形或者表格的形式出现），我尝试了很多多模态模型，过程非常痛苦，结论是cog-agent和emu2对于这类任务很有效。为了更好的提取信息，我制作了一套从研报上下文总结作为prompt一部分的流程。
+最后，我把这些数据做了一个混合。并没有放入通识数据, 因为它就是为了greed而生的。而且行业研报中的知识足够全。
+### 3：关于训练：
+raw text，全参数训练。基座采用了长上下文的yi-34b-200k。这对于完成理解一篇深度报告是必须的。
+当然，我也做了一次sft。这是我的流程中的分析者——目前还没有细分定性和定量分析，但它的效果已经让我大吃一惊了。