2020-02-27PyTorch34 分钟读完 (大约 5133 个字)

PyTorch/[PyTorch 学习笔记] 2.3 二十二种 transforms 图片数据预处理方法

本章代码：https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson2/transforms/

这篇主要分为几个部分介绍 transforms:

裁剪
旋转和翻转
图像变换
transforms 方法操作
自定义 transforms 方法

最后是数据增强的实战：对人民币二分类实验进行数增强。

2020-02-26Java2 分钟读完 (大约 232 个字)

Java/面试题：谈谈你对 Java 的理解

这是一个比较空泛的题，总的来说可以从如下几个方面来回答： - Java 的平台无关性：这个涉及到字节码，虚拟机等，展开可以说很多，详情点击这里 - GC：Java 的垃圾回收，详情点击这里，相关面试题 - 语言特性：反射，泛型，Lambda 等 - 面向对象：封装、继承、多态

2020-02-22Java17 分钟读完 (大约 2481 个字)

Java/面试题：Java 的垃圾回收(GC)

在 JVM 中，一个对象被判断为垃圾的标准是：没有其他对象引用。 # 在实现上，判断对象是否为垃圾的算法有两种： - 引用记数法 - 通过判断对象的被引用数量来判断对象是否可以被回收 - 每个对象实例都有一个引用计数器，被引用则 +1，完成引用则 -1 - 任何引用计数为 0 的对象实例都可以被当做垃圾 - 优点：实现简单，执行效率高，程序执行受影响较小 - 缺点：无法检测出循环引用的情况，导致内存泄露

2020-02-21PyTorch8 分钟读完 (大约 1163 个字)

PyTorch/[PyTorch 学习笔记] 2.2 图片预处理 transforms 模块机制

PyTorch 的数据增强

我们在安装PyTorch时，还安装了torchvision，这是一个计算机视觉工具包。有 3 个主要的模块：

torchvision.transforms: 里面包括常用的图像预处理方法
torchvision.datasets: 里面包括常用数据集如 mnist、CIFAR-10、Image-Net 等
torchvision.models: 里面包括常用的预训练好的模型，如 AlexNet、VGG、ResNet、GoogleNet 等

2020-02-20Java19 分钟读完 (大约 2865 个字)

Java/面试题：Java 虚拟机

平台无关性是通过字节码 + 虚拟机来实现的。Java 源码首先被编译成字节码，再由不同平台的 JVM 进行解析，在不同而平台上运行时不需要重新编译。Java 虚拟机在执行字节码的时候，把字节码转换成具体平台上的机器指令。

2020-02-19PyTorch16 分钟读完 (大约 2437 个字)

PyTorch/[PyTorch 学习笔记] 2.1 DataLoader 与 DataSet

本章代码：https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson2/rmb_classification/

人民币二分类

实现 1 元人民币和 100 元人民币的图片二分类。前面讲过 PyTorch 的五大模块：数据、模型、损失函数、优化器和迭代训练。

数据模块又可以细分为 4 个部分：

数据收集：样本和标签。
数据划分：训练集、验证集和测试集
数据读取：对应于PyTorch 的 DataLoader。其中 DataLoader 包括 Sampler 和 DataSet。Sampler 的功能是生成索引， DataSet 是根据生成的索引读取样本以及标签。
数据预处理：对应于 PyTorch 的 transforms

2020-02-15PyTorch18 分钟读完 (大约 2677 个字)

PyTorch/[PyTorch 学习笔记] 1.5 autograd 与逻辑回归

本章代码：

https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson1/autograd.py

https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson1/logistic-regression.py

自动求导 (autograd)

在深度学习中，权值的更新是依赖于梯度的计算，因此梯度的计算是至关重要的。在 PyTorch 中，只需要搭建好前向计算图，然后利用torch.autograd自动求导得到所有张量的梯度。

2020-02-13Python几秒读完 (大约 110 个字)

Python/使用多进程处理 DataFrame

基本思路是，将DataFrame拆成若干组分，最后通过pandas.concat合并起结果

def parallelize_dataframe(df, func, n_jobs=3, split_num=10):
    ## 拆分数据表
    df_split = np.array_split(df, split_num)
    pool = Pool(n_jobs)
    df_list = []
    
    ## map操作
    for df_element in tqdm_notebook(pool.imap(func, df_split), total=10000):
        df_list.append(df_element)
       
    ## reduce操作
    df = pd.concat(df_list)
    
    ## 关闭进程
    pool.close()
    pool.join()
    return df

还可以使用tqdm在处理数据时显示进度条。

2020-02-12数据库19 分钟读完 (大约 2907 个字)

MySQL/面试题：如何调优 SQL

todo：应该参考陈阳的课程做一个系统的回答

SQL 的调优大致步骤如下：

根据慢日志定位慢查询SQL

MySql 中有很多系统变量，可以通过查询一些变量来获得 MySql 的一些配置信息。我们可以通过以下模糊查询语句来获得包含 query (SQL 查询)有关的系统变量。

2020-02-11PyTorch8 分钟读完 (大约 1159 个字)

PyTorch/[PyTorch 学习笔记] 1.4 计算图与动态图机制

本章代码：https://github.com/zhangxiann/PyTorch_Practice/blob/master/lesson1/computational_graph.py

计算图

深度学习就是对张量进行一系列的操作，随着操作种类和数量的增多，会出现各种值得思考的问题。比如多个操作之间是否可以并行，如何协同底层的不同设备，如何避免冗余的操作，以实现最高效的计算效率，同时避免一些 bug。因此产生了计算图 (Computational Graph)。

PyTorch/[PyTorch 学习笔记] 2.3 二十二种 transforms 图片数据预处理方法

Java/面试题：谈谈你对 Java 的理解

Java/面试题：Java 的垃圾回收(GC)

PyTorch/[PyTorch 学习笔记] 2.2 图片预处理 transforms 模块机制

PyTorch 的数据增强

Java/面试题：Java 虚拟机

PyTorch/[PyTorch 学习笔记] 2.1 DataLoader 与 DataSet

人民币二分类

PyTorch/[PyTorch 学习笔记] 1.5 autograd 与逻辑回归

自动求导 (autograd)

Python/使用多进程处理 DataFrame

MySQL/面试题：如何调优 SQL

SQL 的调优大致步骤如下：

根据慢日志定位慢查询SQL

PyTorch/[PyTorch 学习笔记] 1.4 计算图与动态图机制

计算图

链接

分类

最新文章

归档

标签

PyTorch 的数据增强

人民币 二分类

自动求导 (autograd)

SQL 的调优大致步骤如下：

根据慢日志定位慢查询SQL

计算图

链接

分类

最新文章

归档

标签

人民币二分类