什么是TensorFlow？

前言

只有光头才能变强。
文本已收录至我的GitHub仓库，欢迎Star：https://github.com/ZhongFuCheng3y/3y

回顾前面：

从零开始学TensorFlow【01-搭建环境、HelloWorld篇】

TensorFlow是什么意思？Tensor？Flow？这篇文章介绍TensorFlow一些最基础的知识。

一、Tensor介绍

在介绍之前，首先要记住一个结论：TensorFlow使用Tensor来表示数据

接着我们来看看什么是Tensor，在官网的文档中，Tensor被翻译成”张量“。其中也给出了一个定义：

张量是对矢量和矩阵向潜在的更高维度的泛化，TensorFlow 在内部将张量表示为基本数据类型的n维数组。

不知道你们看完这句话有啥感受，反正我当时就看不懂，啥是”张量“？。于是，我就跑去知乎里边用关键字搜了一下：”张量是什么“。果真给我搜到了相关的问题：《怎么通俗地理解张量?》

https://www.zhihu.com/question/23720923

我本以为通过知乎，就可以通俗易懂地理解什么是张量，能给我一个清晰的认识。殊不知，大多数答主都在回答在物理和数学中张量的定义，随后贴出了一堆我看不懂的公式。其中，也看到了一种相对通俗易懂的定义：

一个量, 在不同的参考系下按照某种特定的法则进行变换, 就是张量.

把所有答主的回答都阅读了一遍，看完就更加抽象了。再回到官方文档中，看看官方介绍张量的例子，貌似有点懂了。

目前为止我们有两个结论：

TensorFlow使用Tensor来表示数据
TensorFlow 在内部将张量表示为基本数据类型的n维数组

我再翻译一下上面的两句话：在TensorFlow所有的数据都是一个n维的数组，只是我们给它起了个名字叫做张量(Tensor)

中间折腾了一大堆，实际上还是将最开头的结论和官方的定义再翻译成自己觉得好理解的话...但很多时候，学习就这么一个过程。

1.1Tensor的基础

从上面我们已经得知，Tensor(张量)实际上就是一个n维的数组。这就延伸了几个的术语：

阶(秩)
形状

1.1.1阶(秩)

其实上，阶就是平时我们所说的维数。

比如我们有一个二维的数组，那么这个阶就是2
比如我们有一个三维的数组，那么这个阶就是3

以前在写Java的时候，可能一般接触到的都是二维的，但在机器学习上就很可能有很高的维度，那维数我们怎么数？很简单，我们数括号就行了。举个例子，我们可能会看到有下面的一个数组输出形式：

[[[9 6]
  [6 9]
  [8 8]
  [7 9]]
 [[6 1]
  [3 5]
  [1 7]
  [9 4]]]

我们直接看第一个括号到第一个数字，有多少个括号就知道了。[[[9可以发现有3个括号，那这个就是一个三维的数组，它的阶(秩)就是3

1.1.2形状

张量的形状可以让我们看到每个维度中元素的数量。

比如我们在Java中创建出一个二维的数组：int [][] array = new int[3][4]，我们就可以知道这个数组有三行有四列。但如果我们创建出一个多维的数组，单单只用行和列就描述不清了。所以，在TensorFlow一般我们会这样描述：

在维度一上元素的个数有3个，在维度二上元素的个数有4个。
其实说到底还是一个意思，但只是说法变了而已。

如果我们要打印上面数组的形状时，我们可以得到这样的结果：shape = (3,4)。我们再看看第一篇写”机器学习HelloWorld“的时候，再来看看当时打印的结果：shape = (60000, 28, 28)。通过shape我们就可以得到一些信息：

当前数组是三维的
在第一维中有60000个元素
在第二维中有28个元素
在第三维中有28个元素

那我们如果拿到一个数组，怎么通过肉眼看他的shape呢？

比如说：m = [[1, 2, 3], [4, 5, 6], [7, 8, 9]]，这个很简单，一眼就可以看出这个是一个二维数组(矩阵)，有三行三列。所以shape的结果应该是(3,3)

再来看一个：t = [[[2], [4], [6]], [[8], [10], [12]], [[14], [16], [18]]]，从多个括号上我们可以看出，这是三维的。我们先把最外层括号去掉得到的结果是[[2], [4], [6]], [[8], [10], [12]], [[14], [16], [18]]

Ok,到这一步，我们可以理解成有三个子数组，于是我们的shape可以先写成shape(3,?,?)