LOADING...
LOADING...
LOADING...
当前位置: 玩币族首页 > 币圈百科 > 加密货币交易者应了解的五种机器学习方法

加密货币交易者应了解的五种机器学习方法

2020-10-16 wanbizu AI 来源:区块链网络

在最近的一篇文章中,我讨论了支持著名的OpenAI的GPT-3的机器学习技术与加密市场的相关性。 可以回答问题,执行语言分析并生成文本的GPT-3可能是近年来深度学习领域最著名的成就。 但是,绝不是最适用于加密货币领域。 在本文中,我想讨论一些新的深度学习领域,这些领域可以对应用于加密的量化模型产生近乎直接的影响。

Jesus Rodriguez是加密资产市场情报平台IntoTheBlock的首席执行官。 他曾在大型技术公司和对冲基金中担任领导职务。 他是纽约哥伦比亚大学的积极投资者,演讲者,作家和客座讲师。

诸如GPT-3或Google的BERT之类的模型是深度学习领域的重大突破的结果,这些突破被称为语言预训练和转换器模型。 可以说,这些技术代表了深度学习行业最近几年的最大里程碑,并且它们的影响在资本市场中并没有被忽视。

去年,在量化金融领域进行了积极的研究,探索了如何将变压器模型应用于不同的资产类别。 但是,这些努力的结果仍然是粗略的,表明变压器远未准备好在财务数据集中运行,并且它们仍然大部分适用于文本数据。 但是没有理由感到难过。 虽然使变压器适应金融场景仍然相对具有挑战性,但当将深度学习领域的其他新领域应用于量化模型中的各种资产类别(包括加密货币)时,就显示出了希望。

订阅Money Reimagined,这是我们关于财务中断的新闻稿。订阅注册后,您将收到有关CoinDesk产品的电子邮件,并且您同意我们的条款和条件以及隐私政策。

从许多角度来看,加密似乎就像是基于深度学习的量化模型的理想资产类别。 这是因为数字DNA和加密资产的透明性,以及加密技术的兴起与机器学习的复兴和深度学习的出现相吻合。

经过数十年的奋斗和几个所谓的“人工智能(AI)寒冬”,深度学习终于成为现实,并在软件行业的不同领域中成为主流。 量化金融一直是新的深度学习技术和研究的最快采用者之一。 市场上一些顶级量化基金通常会尝试使用高科技人工智能研究实验室(例如Facebook,Google或Microsoft)提出的相同类型的想法。

另请参阅:耶稣·罗德里格斯(Jesus Rodriguez)–加密失败的量化策略的10个理由

现代量化融资中一些最令人兴奋的发展并非来自诸如变压器之类的浮华技术,而是源自为量化场景而开发的令人兴奋的机器学习突破。 这些方法中的许多方法都完全适用于加密资产量化技术,并开始涉足加密量化模型。

下面,我列出了深度学习的五个新兴领域,这些领域对于加密量化方案特别重要。 我试图使解释保持相对简单,并适合于加密方案。

1)图神经网络

区块链数据集是加密空间中量化模型的唯一alpha来源。 从结构的角度来看,区块链数据本质上是分层的,并由一个图表示,其中节点表示地址,边表示交易,边连接。 想象一个场景,其中一个定量模型试图根据将资金转移到交易所的地址的特征来预测给定交易所中比特币的波动性。 这种模型需要在分层数据上有效运行。 但是大多数机器学习技术都是设计用于表格数据集的,而不是图形。

图神经网络(GNN)是一门新兴的深度学习学科,其重点是在图数据结构上有效运行的模型。 GNN是在2005年才发明的相对较新的深度学习领域。但是,GNN受到Uber,Google,Microsoft,DeepMind等公司的大量采用。

在我们的示例场景中,GNN可以使用图形作为输入来表示交易所的流入和流出,并推断与其价格影响有关的相关知识。 在加密资产的背景下,GNN具有启用基于区块链数据集的新量化方法的潜力。

2)生成模型

机器学习量化模型的局限性之一是缺少大型历史数据集。 假设您正在尝试基于ChainLink(LINK)的历史交易行为为其价格建立预测模型。 虽然这个概念似乎很吸引人,但由于LINK在像Coinbase这样的交易所中拥有超过一年的历史交易数据,因此可能证明是具有挑战性的。 对于大多数深度神经网络来说,那个小的数据集将不足以概括任何相关知识。

生成模型是一种深度学习方法,专门用于生成与训练数据集的分布相匹配的合成数据。 在我们的场景中,假设我们在Coinbase中的链接订单簿的分布中训练了一个生成模型,以便生成与真实订单簿的分布相匹配的新订单。

结合真实数据集和合成数据集,我们可以构建足够大的数据集来训练复杂的深度学习模型。 生成模型的概念并不是特别新颖,但是近年来随着诸如生成对抗神经网络(GAN)之类的流行技术的出现而受到了广泛的关注,该技术已成为图像分类和图像识别领域中最受欢迎的方法之一。已成功用于时间序列财务数据集。

3)半监督学习

带标签的数据集在加密空间中很稀缺,严重限制了可以在实际场景中构建的机器学习量化模型的类型。 想象一下,我们正在尝试构建一个基于OTC服务台活动进行价格预测的ML模型。 为了训练该模型,我们需要一个大型的标签数据集,其地址属于OTC服务台,这是加密市场中只有少数实体拥有的数据集的类型。

半监督学习是一种深度学习技术,专注于创建可以使用较小的标记数据集和大量未标记的数据进行学习的模型。 半监督学习类似于老师向一群学生介绍一些概念,而其他概念则留给家庭作业和自学。

在我们的示例场景中,假设我们训练了一个模型,其中包含来自OTC柜台的少量标记交易和大量未标记的交易。 我们的半监督学习模型将从标记的数据集中学习关键特征,例如交易规模或频率,并将使用未标记的数据集来扩展训练。

4)表征学习

特征提取和选择是任何定量机器学习模型的关键组成部分,并且与诸如加密资产预测之类的不太了解的问题特别相关。 想象一下,我们正在尝试根据订单记录为比特币的价格建立一个预测模型。

我们努力最重要的方面之一就是确定哪些属性或特征可以充当预测变量。 是中间价格,数量还是其他一百个因素? 传统方法是依靠主题专家来手工制作这些功能,但是随着时间的推移,这些功能很难扩展和维护。

表示学习是深度学习的一个领域,专注于自动化实体表示或特征的学习以构建更有效的模型。 表示学习不依赖于人类特征建模,而是尝试直接从未标记的数据集中推断特征。 在我们的示例中,一种表示学习方法可以分析订单簿并识别成千上万个潜在特征,这些特征可以充当比特币价格的预测指标。 在手动要素工程中无法实现这种级别的缩放和自动化。

5)神经架构搜索

在许多方面,创建量化机器学习模型的过程仍然非常主观。 让我们以一个模型为例,该模型试图根据一组DeFi协议中的活动预测以太坊的价格。 考虑到问题的性质,数据科学家将对要使用的模型和体系结构类型有某些偏好。

在我们的场景中,大多数想法都是基于领域知识和关于DeFi协议中的活动如何影响以太坊价格的主观意见。 鉴于机器学习是建立在知识基础上的,并且知识不是离散的单元,因此对于给定的问题,几乎不可能辩论一种方法与另一种方法的优点。

神经体系结构搜索(NAS)是深度学习的一个领域,它尝试使用机器学习来自动化创建模型。 使用机器学习创建机器学习的一种。 给定目标问题和数据集,NAS方法将评估数百种可能的神经网络架构,并输出结果最有希望的架构。

在我们的示例场景中,NAS方法可以处理在去中心化交易所中合并交易的数据集,并生成一些模型,这些模型可以根据这些记录潜在地预测以太坊的价格。

还有更多

上述方法代表了深度学习的一些新兴领域和更发达的领域,它们可能在短期内对加密量化模型产生影响。 而且,这些绝不是深度学习加密量化的唯一领域。

其他深度学习学科,例如强化学习,自我监督学习,甚至变压器,都正在迅速进入定量领域。 关于应用于量化模型的深度学习技术的研究和实验无处不在,加密技术将成为这一波创新浪潮的巨大受益者。

—-

原文链接:https://www.coindesk.com/five-machine-learning-methods-crypto-traders-should-know-about

原文作者:Jesus Rodriguez

编译者/作者:wanbizu AI

玩币族申明:玩币族作为开放的资讯翻译/分享平台,所提供的所有资讯仅代表作者个人观点,与玩币族平台立场无关,且不构成任何投资理财建议。文章版权归原作者所有。

LOADING...
LOADING...