tensorflow Dataset及TFRecord一些要点【持续更新】

sherry颖 2019-12-22

关于tensorflow结合Dataset与TFRecord这方面看到挺好一篇文章：

https://cloud.tencent.com/developer/article/1088751

github：

https://github.com/YJango/TFRecord-Dataset-Estimator-API/blob/master/TensorFlow%20Dataset%20%2B%20TFRecords.ipynb

dataset要点：

一般先shuffle，然后batch，再repeat

当然可以先repeat再batch，这样做与前面一个的区别就是最后一个batch是会有一部分之前batch里出现过的数据，在测试集上这么做要谨慎。

dataset的one_shot_iterator和make_initializable_iterator

看到stackoverflow上有个问题：

https://stackoverflow.com/questions/48091693/tensorflow-dataset-api-diff-between-make-initializable-iterator-and-make-one-sho

其实我觉得题主想问的不是答主说的意思，实际上one-shot迭代器只能迭代一轮，initializable迭代器可以迭代多轮（通过sess.run(iterator.initializer）来实现。那么这两种迭代器的区别就非常明显了，换句话说，题主的第二个代码片段，除了第0个epoch之外，剩下的所有epoch都没有数据，会报错。

可以看下面这段代码来测试：

import tensorflow as tf
import numpy as np
dataset = tf.data.Dataset.from_tensor_slices(np.random.uniform(size=(5, 2))).shuffle(100).batch(2)
iterator = dataset.make_initializable_iterator()
# iterator = dataset.make_one_shot_iterator()
one_element = iterator.get_next()
with tf.Session() as sess:

    for i in range(5):
        sess.run(iterator.initializer)
        while True:
            try:
                print(sess.run(one_element))
            except tf.errors.OutOfRangeError:
                print("Epoch %s is done." % i)
                break

: sherry颖

相关推荐

TensorFlow为新旧Mac特供新版本，速度最高提升7倍

苹果「一呼百应」的号召力在机器学习领域似乎也不例外。新版 Mac 推出还不到两周，谷歌就把专为 Mac 优化的 TensorFlow 版本做好了，训练速度最高提升到原来的 7 倍。对于开发者、工程师、科研工作者来说，Mac 一直是非常受欢迎的平台，也有人用

Micusd 0喜欢 / 0评论 2020-11-19

如何在PyTorch和TensorFlow中训练图像分类模型

图像分类是计算机视觉的最重要应用之一。它的应用范围包括从自动驾驶汽车中的物体分类到医疗行业中的血细胞识别，从制造业中的缺陷物品识别到建立可以对戴口罩与否的人进行分类的系统。他们是如何做到的呢？你必须已阅读很多有关不同深度学习框架之间差异的信息。Tensor

xjtukuixing 0喜欢 / 11评论 2020-10-27

对比PyTorch和TensorFlow的自动差异和动态模型

使用自定义模型类从头开始训练线性回归，比较PyTorch 1.x和TensorFlow 2.x之间的自动差异和动态模型子类化方法，这篇简短的文章重点介绍如何在PyTorch 1.x和TensorFlow 2.x中分别使用带有模块/模型API的动态子类化模型

lybbb 0喜欢 / 0评论 2020-10-15

现在知道还不算晚，输入示例自动生成代码，谷歌开源这项神器要火

操作张量并非易事，因为它需要很多先决条件，例如跟踪多个维度，Dtype兼容性，数学正确性和张量形状等。当然最大的挑战还是从数百种可用选项中确定正确的TensorFlow操作。如果会的话，谷歌的TensorFlow Coder可以帮你实现这一点。然后，它会运

lybbb 0喜欢 / 0评论 2020-09-29

TensorFlow推出新接口，简化 ML移动端开发流程

在移动设备上使用 TensorFlow Lite 模型运行推理不仅仅是与模型交互，还需要额外的代码来处理复杂的逻辑，如数据转换、预处理/后处理、加载关联文件等。今天，我们将为大家介绍TensorFlow Lite Task Library，这是一组功能强大

ghjk0 0喜欢 / 0评论 2020-09-24

如何在浏览器中使用TensorFlow？

TensorFlow 2.0引入的创新之一是JavaScript实现：TensorFlow.js。我没料到这会加快训练或推理速度，但确实如此，它通过WebGL API支持所有的GPU。TensorFlow.js是一个库，用于使用JavaScript开发

yamaxifeng 0喜欢 / 0评论 2020-09-09

2020年深度学习框架对比速读

TensorFlow于2015年11月面世，基于Apache License 2.0协议发布，由Google Brain团队研发。到目前为止也是github上热度最高、使用人数最多的深度学习框架，业界很多招聘要求中也提到了它。2019年3月推出Tenso

GDGYZL 0喜欢 / 0评论 2020-08-28

输入示例，自动生成代码：TensorFlow官方工具TF-Coder已开源

如何使编程更加便捷？最近，谷歌 TensorFlow 开源了一个帮助开发者写 TensorFlow 代码的程序合成工具 TF-Coder。用过 TensorFlow 框架的应该都知道，在操纵张量时，需要跟踪多个维度、张量形状和数据类型兼容性，当然还需要考虑

lybbb 0喜欢 / 0评论 2020-08-28

TensorFlow Lattice：灵活、可控、可解释的机器学习

本文转自雷锋网，如需转载请至雷锋网官网申请授权。大多数的机器学习实践者都曾遇到过训练数据和实际运行时用以评估模型的样本差别很大的情况。因此，相对灵活的机器学习解决方案，如DNN和随机森林等，仅依赖于训练数据的模型，在训练数据集和验证数据集没有覆盖的输入空间

Icevivian 0喜欢 / 0评论 2020-08-25

TensorFlow 2入门指南，初学者必备！

TensorFlow是谷歌推出的深度学习框架，于2019年发布了第二版。它是世界上最著名的深度学习框架之一，被行业专家和研究人员广泛使用。Tensorflow v1难以使用和理解，因为它的Pythonic较少，但是随着Keras发行的v2现在与Tenso

comwayLi 0喜欢 / 0评论 2020-08-16

使用tensorflow进行音乐类型的分类

音乐流媒体服务的兴起使得音乐无处不在。我们在上下班的时候听音乐，锻炼身体，工作或者只是放松一下。这些数据可能来自出版歌曲的人手工标注。但这并不是一个很好的划分，因为可能是一些艺人想利用一个特定流派的流行趋势。在描述了所使用的数据源之后，我对我们使用的方法及

carbon0 0喜欢 / 0评论 2020-08-16

【tensorflow】常量和变量的定义

data1 = tf.constant # 声明常量。data2 = tf.Variable # 声明变量。print # 打印数据的

源式羽语 0喜欢 / 0评论 2020-08-09

如何在tensorflow中判断tensor(张量)的值

众所周知，在tensorflow程序中，tensor只是占位符，在会话层没有run出tensor的值之前，我们是无法获知tensor的值的。也就是说，下面的逻辑是无法实现的：。#a is a 1-D tensor, b is a 1-D tensor to

sherry颖 0喜欢 / 0评论 2020-08-01

TensorFlow会话常用的两种方式

需要注意的是我们可以使用两种方法来创建并使用session. 我们计算WX+b，其中W，X和b是从随机正态分布中抽取的。我们开始定义一个shape=（3,1）的常量X：。实现一个线性功能：。初始化X，类型为tensor的随机变量，维度为(3,1). res

songbinxu 0喜欢 / 0评论 2020-07-19

Ｍnist手写数字识别 Tensorflow

MNIST 数据集来自美国国家标准与技术研究所, National Institute of Standards and Technology . 训练集由来自 250 个不同人手写的数字构成, 其中 50% 是高中学生, 50% 来自人口普查局的

sherry颖 0喜欢 / 0评论 2020-07-18

TensorFlow被曝存严重bug，搭配Keras可能丢失权重，至今仍未修复

每个在自定义层中使用Keras函数式API的用户都要注意了！使用用Keras的Functional API创建的权重，可能会丢失。这一话题在Reddit机器学习板块上被热议，引起不少TensorFlow用户共鸣。也就是说，原本需要训练的权重现在被冻结了。让

Niteowl 0喜欢 / 0评论 2020-07-15

TensorFlow中超大的30个机器学习数据集

由谷歌Brain的研究人员创建的TensorFlow是机器学习和数据科学领域最大的开源数据库之一。它是一个端到端的平台，适用于初学者和有经验的数据科学家。TensorFlow库包括工具、预训练模型、机器学习指南，以及开放数据集的语料库。为了帮助你找到所需的

Kindle君 0喜欢 / 0评论 2020-07-15

解决import tensorflow报错：ImportError: DLL load failed: 找不到指定的模块

将visual c++ 升级到2019版本。安装完之后，即可解决该问题。

源式羽语 0喜欢 / 0评论 2020-07-04

Yolo v3 Introduction to object detection with TensorFlow 2

https://medium.com/analytics-vidhya/yolo-v3-introduction-to-object-detection-with-tensorflow-2-ce75749b1c47

源式羽语 0喜欢 / 0评论 2020-06-28

Sklearn 与 TensorFlow 机器学习实用指南第二版

十六、使用 RNN 和注意力机制进行自然语言处理

卖小孩的咖啡 0喜欢 / 0评论 2020-06-28

Keras安装 {Keras 由浅入深}

dependencies:cuDNN .HDF5 and h5py .graphviz and pydot .用tensorflow能够使得传统的keras程序有较好的扩展性。

dataastron 0喜欢 / 0评论 2020-06-25

ubuntu 18.04 安装tensorflow 2 cuda10 CUDNN Anaconda3

1.nvidia 驱动a.卸载系统里低版本的英伟达驱动sudo apt-get purge nvidia*b.把显卡驱动加入PPAsudo add-apt-repository ppa:graphics-driverssudo apt-get update

JM 0喜欢 / 0评论 2020-06-21

Convolutional Neural Network-week1编程题（TensorFlow实现手势数字识别）

the SIGNS dataset is a collection of 6 signs representing numbers from 0 to 5.TensorFlow requires that you create placeholders f

lybbb 0喜欢 / 0评论 2020-06-16

Tensorflow 2.0 DLL load failed: 找不到指定的模块

原因及解决的办法:以前是用pip install tensorflow-gpu安装的,没有指定版本,删除以前安装的版本,指定版本为2.0.0-alpha0安装:

lybbb 0喜欢 / 0评论 2020-06-16

TensorFlow开发者证书中文手册

经过一个月的准备，终于通过了TensorFlow的开发者认证，由于官方的中文文档较少，为了方便大家了解这个考试，同时分享自己的备考经验，让大家少踩坑，我整理并制作了这个中文手册，请大家多多指正，有任何问题和建议都可以在文末联系到我~同时，感谢各位大牛们期间

sherry颖 0喜欢 / 0评论 2020-06-11

TensorFlow从0到1之TensorFlow多层感知机函数逼近过程（23）

本节将展示如何使用多层感知机进行函数逼近，具体来说，是预测波士顿的房价。第2章使用回归技术对房价进行预测，现在使用 MLP 完成相同的任务。输入应该归一化，隐藏层是 ReLU，输出层最好是 Sigmoid。在这里，使用TensorFlow操作层来构建神经网

louishao 0喜欢 / 0评论 2020-06-08

TensorFlow从0到1之TensorFlow超参数及其调整（24）

正如你目前所看到的，神经网络的性能非常依赖超参数。因此，了解这些参数如何影响网络变得至关重要。常见的超参数是学习率、正则化器、正则化系数、隐藏层的维数、初始权重值，甚至选择什么样的优化器优化权重和偏置。与之前一样，在TensorFlow中构建模型。在 Te

源式羽语 0喜欢 / 0评论 2020-06-08

TensorFlow从0到1之TensorFlow多层感知机实现MINIST分类（22）

TensorFlow支持自动求导，可以使用 TensorFlow 优化器来计算和使用梯度。本节将使用 TensorFlow 优化器来训练网络。前面章节中，我们定义了层、权重、损失、梯度以及通过梯度更新权重。用公式实现可以帮助我们更好地理解，但随着网络层数的

lybbb 0喜欢 / 0评论 2020-06-08

TensorFlow从0到1之TensorFlow实现反向传播算法（21）

反向传播算法是神经网络中研究最多、使用最多的算法之一，它用于将输出层中的误差传播到隐藏层的神经元，然后用于更新权重。学习 BPN 算法可以分成以下两个过程：。在输出层，计算误差和损失函数。这两个过程重复迭代直到收敛。现在已经有方程了，看看如何在Tensor

bluewelkin 0喜欢 / 0评论 2020-06-08

Tensorflow testing for Ubuntu 18.04.1

Ubuntu18.04的系统使用NVxxx.run安装时会提示GCC版本不匹配，所以这里换一种方式安装NVIDIA驱动，具体方法如下：。在最后一行添加“blacklistnouveau”,输入完之后按Ctrl+O，然后按Enter键，再按Ctrl+X退出编

lybbb 0喜欢 / 0评论 2020-06-08

TensorFlow 基础 (04)

都停滞好几天自己的学习了, 困惑中, 就很难去集中精力搞自己的事情, 因此周末还要给续上一点的. 这篇主要学一波张量的直观用.标量在 TF 中, 就是一个维度为 0 , shape 为 [ ] 的数字. 我觉得这些概念, 回归数学概念来理解会更加地直观

sherry颖 0喜欢 / 0评论 2020-06-07

tensorflow 将数值限制在一定范围内

当1-y小于1e-10时，输出1e-10；当1-y大于1e-10小于1.0时，输出原值；当1-y大于1.0时，输出1.0；

源式羽语 0喜欢 / 0评论 2020-06-05

使用tensorflow对模型进行量化

本文旨在将训练好的模型基于tensorflow自带工具进行量化。注意这里使用oracle的JDK，在官方指南中安装open JDK的部分替换参考如下博文安装oracle JDK：。安装完毕后使用我们将使用bazel对上述2中完成训练的模型进行编译。chec

louishao 0喜欢 / 0评论 2020-06-03

TensorFlow 基础 (03)

项目再忙碌, 还是要抽出时间来学习的.继续学习一波, 不管了. 这篇来练习张量 tensor 的创建.Python 的这些 "容器" 或者数据结构, 用的最多的必然是 List 了, 各种骚操作哇. 然后做数据分析处理, Panda

源式羽语 0喜欢 / 0评论 2020-06-02

iPhone 11 训练神经网络的开源项目火了，准确率可与 i7 MacBook Pro 持平

前几天有人发布了一个可以在 iOS设备上直接训练神经网络的开源项目MNIST-CoreML-Training，引起热议。项目使用 MNIST 手写数字数据集部署图像分类模型，不需要在其他 ML框架中训练，而是基于 Core ML直接本地训练出一个卷积神经网

樱花落瓣 0喜欢 / 0评论 2020-06-01

TensorFlow实现鸢尾花分类

for step, in enumerate: # 对打包的训练集进行batch训练。y_ = tf.one_hot # 对训练集的标签进行one_hot编码。grads = tape.gradient # 对loss中的w1，b1进行求导。print #

sherry颖 0喜欢 / 0评论 2020-05-31

如何使用TensorFlow提供的models训练人脸识别的网络?

如何使用TensorFlow提供的models训练人脸识别的网络?前提是我们已经有train和test的record数据格式文件。修改使用的网络,使其为我所用。- num_class: 分类类别数,人脸识别设为1. - batch_size: 我的计算能力

louishao 0喜欢 / 0评论 2020-05-30

TensorFlow函数 tf.argmax()

dimension：按某维度查找。　　　　dimension=0：按列查找；　　　　dimension=1：按行查找；# axis=1的时候，将每一行最大元素所在的索引记录下来，最后返回每一行最大元素所在的索引数组。

louishao 0喜欢 / 0评论 2020-05-28

在Data Collector中如何使用TensorFlow实现实时机器学习

在深入讨论细节之前，我们先一起理清几个基本概念。随着机器学习技术的发展，如今的电脑已经能够做出与人类相似、甚至更好的预测。在解决问题的方式上，机器学习通常分为两大类：。目前，它是GitHub上最受欢迎、且最活跃的机器学习项目之一。例如，检测高风险地区的洪水

xceman 0喜欢 / 0评论 2020-05-28

机器学习：TensorFlow 2.0中的10个技巧

在本文中，我们将探索TensorFlow 2.0的10个特性。这是tensorflow.keras API的最佳特性之一。ImageDataGenerator可以在batching和预处理中实时生成数据集切片和数据增强。生成器允许直接从目录或datafr

jocelyn0 0喜欢 / 0评论 2020-05-19

机器学习必备：TensorFlow的11个使用技巧整理

TensorFlow2.x在构建模型和总体使用方面提供了很多便利。那么，在tf中有什么新功能？在任何平台上的生产中都可以进行稳健的模型部署；强大的研究实验；在本文中，我们将探索TF 2.0的10个功能，这些功能让TensorFlow的使用更加顺畅，减少了代

Micusd 0喜欢 / 0评论 2020-05-19

pycharm碰到tensorflow下载超时的问题

在下载路径已是国内镜像的情况下，解决办法：。也可加上国内镜像，如下做法：

源式羽语 0喜欢 / 0评论 2020-05-17

教你避过安装TensorFlow的两个坑

TensorFlow作为著名机器学习相关的框架，很多小伙伴们都可能要安装它。WIN+R，输入cmd运行后，通常可能就会pip install tensorflow直接安装了，但是由于这个库比较大，接近500M，加上这个是国外链，特别慢，所以需要镜像网站来帮

sherry颖 0喜欢 / 0评论 2020-05-17

旷视教会我如何安装tensorflow环境|这才是真正的pip install tensorflow

conda create -n tensorflow python=3.6 建立python3.6虚拟环境，安装tensorflow. 然后用清华镜像，代替pip官网，快速下载你想要的包。因为我自己在虚拟环境中装过tensorflow了，所以再次进入

sherry颖 0喜欢 / 0评论 2020-05-12

使用TensorFlow对图像进行随机旋转的实现示例

在使用深度学习对图像进行训练时，对图像进行随机旋转有助于提升模型泛化能力。然而之前在做旋转等预处理工作时，都是先对图像进行旋转后保存到本地，然后再输入模型进行训练，这样的过程会增加工作量，如果图片数量较多，生成旋转的图像会占用更多的空间。直接在训练过程中便

JM 0喜欢 / 0评论 2020-05-10

tensorflow 测量工具，与自定义训练

# 新建测量器m = tf.keras.metrics.Accuracy()# 写入测量器m.update_state([0,1,1],[0,1,2])# 读取统计信息m.result() # 准确率为0.66# 清除m.reset_states() a

lybbb 0喜欢 / 0评论 2020-05-05

多元线性回归问题（Tensorflow 求解）

多元线性回归问题求解使用的数据集是经典的boston房价数据。一共506个数据，后面56个数据我将其划了出来作为测试集。比较的简单，主要是学习步骤与算法。该数据集每一个样本包括12个特征变量和该地区的平均房价。# 选取测试集的第36个数据测试，也可以选择其

JM 0喜欢 / 0评论 2020-05-04

tensorflow联邦学习框架整理

定义模型需要继承自tff.learning.Model类，同时根据联邦学习的流程需要定义好，模型训练和辅助训练变量。变量必须要使用tf的类型，因为在实际环境中，联邦学习是要部署到移动端的，调用的不一定是python。有了上面的模型参数、前向传播、返回结果和

louishao 0喜欢 / 0评论 2020-05-04

mask_rcnn faster_rcnn yolov3 light-head

Light head rcnn https://github.com/Stick-To/light-head-rcnn-tensorflowmask_rcnn https://github.com/tensorflow/modelsfaster_rcnn

sherry颖 0喜欢 / 0评论 2020-05-03

tensorflow 2.0 实战 CT cervix 图像分割 U-Net网络（二）初步认识U-Net网络

U-Net网络模型属于全卷积神经网络的一种，是一个有监督的端到端的图像分割网络，由弗莱堡大学Olaf在ISBI举办的细胞影像分割比赛中提出的[1]。其网络结构形式字母U，如图，命名为U-Net，网络主要由两部分，收缩路径（编码层）和扩展路径（解码层），前者

EchoYY 0喜欢 / 0评论 2020-05-01