Apache Ignite上的TensorFlow!分布式内存数据源.doc

上传人:白大夫 文档编号:3249573 上传时间:2019-08-06 格式:DOC 页数:6 大小:30KB
返回 下载 相关 举报
Apache Ignite上的TensorFlow!分布式内存数据源.doc_第1页
第1页 / 共6页
亲,该文档总共6页,到这儿已超出免费预览范围,如果喜欢就下载吧!
资源描述

《Apache Ignite上的TensorFlow!分布式内存数据源.doc》由会员分享,可在线阅读,更多相关《Apache Ignite上的TensorFlow!分布式内存数据源.doc(6页珍藏版)》请在三一文库上搜索。

1、Apache Ignite上的TensorFlow!分布式内存数据源任何深度学习都是从数据开始。这是非常关键的一点。没有数据,我们就无法训练模型,也无法评估模型质量,更无法做出预测。因此,数据源非常重要。在做研究、构建新的神经网络架构,以及做实验时,我们习惯使用最简单的本地数据源,通常是不同格式的文件。这种方法确实非常有效。但在某种情况下,我们需要更加接近生产环境。这时,简化和加速生产数据馈送,以及能够处理大数据就变得非常重要。这也正是 Apache Ignite 大展身手的时候。Apache Ignite是以内存为中心的分布式数据库,也是事务性、分析性和流式工作负载的缓存和处理平台,可以实现

2、 PB 级的内存速度。借助 Apache Ignite 和 TensorFlow 之间的现有集成,您可以将 Apache Ignite 用作神经网络训练和推理的数据源,也可以将其用作分布式训练的检查点存储空间和集群管理器。分布式内存数据源作为以内存为中心的分布式数据库,Apache Ignite可以提供快速数据访问。让您能够摆脱硬盘限制,在分布式集群中存储和处理您需要的所有数据。您可以通过使用 Ignite Dataset 来利用 Apache Ignite 的这些优势。请注意,Apache Ignite 不只是数据库或数据仓库与 TensorFlow 之间 ETL 管道的一个步骤,它还是一个

3、HTAP(混合事务 / 分析处理)系统。通过选择 Apache Ignite 和 TensorFlow,您会获得一个用于事务和分析处理的单一系统,同时还可以使用操作和历史数据进行神经网络训练和推理。以下基准测试结果表明,Apache Ignite 非常适合用于单节点数据存储用例。如果存储空间和客户端位于同一节点,则通过使用 Apache Ignite,您可以实现每秒超过 850 MB 的吞吐量。如果存储空间位于与客户端相关的远程节点,则吞吐量约为每秒 800 MB。当存在一个本地 Apache Ignite 节点时 Ignite Dataset 的吞吐量。执行该基准测试时使用的是 2 个 Xe

4、on E52609 v4 1.7GHz 处理器,配备 16Gb 内存和每秒 10 Gb 的网络(1MB 的行和 20MB 的页面大小)另一个基准测试表明 Ignite Dataset 如何与分布式 Apache Ignite 集群协作。这是 Apache Ignite 作为 HTAP 系统的默认用例,它使您能够在每秒 10 Gb 的网络集群上为单个客户端实现每秒超过 1 GB 的读取吞吐量。分布式 Apache Ignite 集群具备不同数量的节点(从 1 到 9)时 Ignite Dataset 的吞吐量。执行该基准测试时使用的是 2 个 Xeon E52609 v4 1.7GHz 处理器,

5、配备 16Gb 内存和每秒 10 Gb 的网络(1MB 的行和 20MB 的页面大小)测试后的用例如下:Apache Ignite 缓存(以及第一组测试中数量不同的分区和第二组测试中的 2048 个分区)由 10000 个大小为 1MB 的行填充,然后 TensorFlow 客户端使用 Ignite Dataset 读取所有数据。所有节点均以 2 个 Xeon E52609 v4 1.7GHz 处理器表示,配备 16Gb 内存和每秒 10Gb 的网络连接。每个节点使用默认 配置运行 Apache Ignite。注:配置 链接https:/github/apache/ignite/blob/ma

6、ster/examples/config/example-default.xml您可以很轻松地将 Apache Ignite 同时用作带有结构化查询语言 (SQL) 界面的传统数据库和 TensorFlow 数据源。apache-ignite/bin/ignite.shapache-ignite/bin/sqlline.sh -u jdbc:ignite:thin:/localhost:10800/CREATE TABLE KITTEN_CACHE (ID LONG PRIMARY KEY, NAME VARCHAR);INSERT INTO KITTEN_CACHE VALUES (1, W

7、ARM KITTY);INSERT INTO KITTEN_CACHE VALUES (2, SOFT KITTY);INSERT INTO KITTEN_CACHE VALUES (3, LITTLE BALL OF FUR);import tensorflow as tffrom tensorflow.contrib.ignite import IgniteDatasettf.enable_eager_execution()dataset = IgniteDataset(cache_name=SQL_PUBLIC_KITTEN_CACHE)for element in dataset: p

8、rint(element)key: 1, val: NAME: bWARM KITTYkey: 2, val: NAME: bSOFT KITTYkey: 3, val: NAME: bLITTLE BALL OF FUR结构化对象使用Apache Ignite,您可以存储任何类型的对象。这些对象可以具备任何层次结构。Ignite Dataset 能够处理此类对象。import tensorflow as tffrom tensorflow.contrib.ignite import IgniteDatasettf.enable_eager_execution()dataset = Ignit

9、eDataset(cache_name=IMAGES)for element in dataset.take(1): print(element) key: kitten.png, val: metadata: file_name: bkitten.png, label: blittle ball of fur, width: 800, height: 600 , pixels: 0, 0, 0, 0, ., 0 如果您使用 Ignite Dataset,则神经网络训练和其他计算所需的转换都可以作为tf.data管道的一部分来完成。import tensorflow as tffrom ten

10、sorflow.contrib.ignite import IgniteDatasettf.enable_eager_execution()dataset = IgniteDataset(cache_name=IMAGES).map(lambda obj: objvalpixels)for element in dataset: print(element)0, 0, 0, 0, ., 0分布式训练作为机器学习框架,TensorFlow 可以为分布式神经网络训练、推理及其他计算提供原生支持。分布式神经网络训练的主要理念是能够在每个数据分区(根据水平分区)上计算损失函数的梯度(例如,误差的平方)

11、,然后对梯度求和,以得出整个数据集的损失函数梯度。借助这种能力,我们可以在数据存储位置的节点上计算梯度,减少梯度,最后更新模型参数。这样,您就无需在节点间传输数据,从而避免了网络瓶颈。Apache Ignite 在分布式集群中使用水平分区存储数据。在创建 Apache Ignite 缓存(或基于 SQL 的表格)时,我们可以指定将要在此对数据进行分区的分区数量。例如,如果一个 Apache Ignite 集群由 100 台机器组成,我们创建了一个有 1000 个分区的缓存,则每台机器将要维护 10 个数据分区。Ignite Dataset 允许使用分布式神经网络训练(使用 TensorFlow

12、)和 Apache Ignite 分区的这两个方面。Ignite Dataset 是一个可以在远程工作器上执行的计算图操作。远程工作器可以通过为工作器进程(例如 IGNITE_DATASET_HOST、IGNITE_DATASET_PORT 或 IGNITE_DATASET_PART)设置相应的环境变量来替换 Ignite Dataset 的参数(例如主机、端口或分区)。使用这种替换方法,我们可以为每个工作器分配一个特定分区,这样一个工作器处理一个分区,同时可以与单个数据集透明协作。import tensorflow as tffrom tensorflow.contrib.ignite im

13、port IgniteDatasetdataset = IgniteDataset(IMAGES)# Compute gradients locally on every worker node.gradients = for i in range(5): with tf.device(/job:WORKER/task:%d % i): device_iterator = tfpat.v1.data.make_one_shot_iterator(dataset) device_next_obj = device_iterator.get_next() gradient = compute_gr

14、adient(device_next_obj) gradients.append(gradient)# Aggregate them on master node.result_gradient = tf.reduce_sum(gradients)with tf.Session(grpc:/localhost:10000) as sess: print(sess.run(result_gradient)借助 Apache Ignite,您还可以使用 TensorFlow 高级Estimator API来进行分布式训练。此功能以所谓的 TensorFlow 分布式训练的 独立客户端模式 为基础,

15、Apache Ignite 在其中发挥数据源和集群管理器的作用。与此相关的内容,我们将在下一篇文章中全面介绍。注:独立客户端模式 链接https:/github/tensorflow/tensorflow/tree/master/tensorflow/contrib/distribute#standalone-client-mode检查点存储除数据库功能外,Apache Ignite 还有一个名为IGFS的分布式文件系统。IGFS 可以提供与 Hadoop HDFS 类似的功能,但仅限于内部存储。事实上,除自有 API 外,IGFS 还采用了 Hadoop FileSystem API,并且可

16、以透明地插接到 Hadoop 或 Spark 部署中。Apache Ignite 上的 TensorFlow 支持 IGFS 与 TensorFlow 集成。该集成基于 TensorFlow 端的 自定义文件系统插件 和 Apache Ignite 端的IGFS Native API。它有许多用例,例如:可以将状态检查点保存到 IGFS 中,以获得可靠性和容错性训练过程可以通过将事件文件写入 TensorBoard 监视的目录来与 TensorBoard 通信。即使 TensorBoard 在不同的进程或机器中运行,IGFS 也允许进行此通信注:自定义文件系统插件 链接https:/tenso

17、rflow/guide/extend/filesystemIGFS Native API 链接https:/ignite.apache/features/igfsl此功能于 TensorFlow 1.13 中发布,并将在 TensorFlow 2.0 中作为tensorflow/io的一部分发布。注:tensorflow/io 链接https:/github/tensorflow/ioSSL 连接通过 Apache Ignite,您可以使用SSL和身份验证来保护数据传送渠道。Ignite Dataset 支持具备和不具备身份验证的 SSL 连接。如需更多信息,请参阅Apache Ignite

18、SSL/TLS文档(https:/apacheignite.readme.io/docs/ssltls)。import tensorflow as tffrom tensorflow.contrib.ignite import IgniteDatasettf.enable_eager_execution()dataset = IgniteDataset(cache_name=IMAGES, certfile=client.pem, cert_password=password, username=ignite, password=ignite)Windows 支持Ignite Dataset

19、完全兼容 Windows 系统。您可以在 Windows 工作站和 Linux/MacOS 系统上将其用作 TensorFlow 的一部分。试用以下示例将帮助您轻松开始使用此模块。Ignite Dataset要试用 Ignite Dataset,最简单的方法是使用 Apache Ignite 和加载好的MNIST数据运行Docker容器,然后使用 Ignite Dataset 与其交互。您可以在 Docker Hub:dmitrievanthony/ignite-with-mnist上找到此容器。您需要在机器上启动此容器:docker run -it -p 10800:10800 dmitri

20、evanthony/ignite-with-mnist注:MNIST 链接http:/yann.lecun/exdb/mnist/dmitrievanthony/ignite-with-mnist 链接https:/hub.docker/r/dmitrievanthony/ignite-with-mnist/然后您可以按照以下方法使用它:IGFSTensorFlow 的 IGFS 支持功能于 TensorFlow 1.13 中发布,并将在 TensorFlow 2.0 中作为tensorflow/io的一部分发布。如要通过 TensorFlow 试用 IGFS,最简单的方法是使用 Apache

21、 Ignite 和 IGFS 来运行Docker容器,然后使用 TensorFlowtf.gfile与其交互。您可以在 Docker Hub:dmitrievanthony/ignite-with-igfs上找到此容器。您可以在自己的机器上运行此容器:docker run -it -p 10500:10500 dmitrievanthony/ignite-with-igfs然后您可以按照以下方法使用它:import tensorflow as tfimport tensorflow.contrib.ignite.python.ops.igfs_opswith tf.gfile.Open(igf

22、s:/hello.txt, mode=w) as w: w.write(Hello, world!)with tf.gfile.Open(igfs:/hello.txt, mode=r) as r: print(r.read()Hello, world!限制目前,Ignite Dataset 需要假设缓存中的所有对象都具有相同的结构(同类型对象),并且缓存中至少包含一个检索架构所需的对象。另一个限制与结构化对象有关,Ignite Dataset 不支持通用唯一识别码 (UUID)、地图和可能是对象结构组成部分的对象数组。所有这些限制都是进一步开发的主题。即将发布的 TensorFlow 2.0TensorFlow 2.0 中即将发布的新变更会将此功能分离到tensorflow/io模块。之后,您将可以更加灵活地使用此功能。这些示例将略有改动,我们的文档和示例也会反映这一点。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 其他


经营许可证编号:宁ICP备18001539号-1