-
背景 公司内部的基于torch的toolbox发现某个版本之后,结果发生了偏移. 通过一系列排查,发现当导入cupy和torch的顺序不同时,计算结果会有所差异。 也就是说,如下两段代码会导致模型训练等环节的计算得到不同的结果. 1import cupy as cp 2import torch 1import torch 2import cupy as cp 3 最小复现代码 经过一番努力,把问题从内部框架中剥离了出来. 如下是得到的最小复现代码. 通过调整import cupy与import torch的相对顺序,会得到不同的结果. 1# import cupy as cp 2import torch 3import …
Read More -
再次迫于生计。。。 参考了面向新人的 Python 爬虫学习资料 大致的学习路线为: 一: 简单的定向脚本爬虫( request --- bs4 --- re ) 二: 大型框架式爬虫( Scrapy 框架为主) 三:浏览器模拟爬虫 ( Mechanize 模拟 和 Selenium 模拟) 有Python基础和一点html基础的话。。。貌似上手是0难度的 年轻人的第一个爬虫(虽然代码是直接copy的... ''' 抓取百度贴吧---生活大爆炸吧的基本内容 爬虫线路: requests - bs4 Python版本: 3.6 OS: mac os 12.12.4 ''' import requests import time …
Read More -
import os import math ave_err=0.0 max_err=0.0 max_err_rate=0.0 length=0 with open("cpu_result.txt","r") as fp1, open("cuda_ppl_result.txt","r") as fp2: for l1 in fp1: l2 = fp2.readline() l1=l1[:-2] l2=l2[:-2] lst = l1.split(' ') lst2 = l2.split(' ') #print lst lst = [float(x) for …
Read More -
记录一些常用的...总去查文档也是有点麻烦 * tensor.view 的作用是reshape 比如 a = torch.range(1, 16) 得到一个tensor that has 16 elements from 1 to 16. 在a=a.view(4,4)就得到了一个44的tensor。 需要注意reshape之后元素的个数不能改变(16==44) 参数-1的作用是,我懒得算这一维度应该是多少,(由于元素个数不能改变)所以希望自动被计算。**需要注意的是,只有一个维度可以写-1。 **不过view和reshape有些区别:reshape always copies memory. view never copies …
Read More -
先放一个同事安利给我的网站:regex101 查询匹配的中文字符unicode编码 正则表达式用于字符串处理、表单验证、日志数据分析等场合,实用高效。现将自己走网上搜索并总结的常用方法收集了一下: 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内):[^\x00-\xff] 注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:\n\s*\r 注:可以用来删除空白行 匹配HTML标记的正则表达式:<(\S_?)[^>]>.?</>|<._? /> 注:网 …
Read More -
list = os.listdir(rootdir)#列出目录下的所有文件和目录 for line in list: filepath = os.path.join(rootdir,line) if os.path.isdir(filepath):#如果filepath是目录 print "dir:" + filepath else: print "file:" + filepath 如果需要遍历文件夹下的所以文件,可以使用os.walk()方法。 os.walk()返回一个三元素的tuple:当前路径、子文件夹名称、文件列表。 import os for root, dirs, files …
Read More -
原文链接 感谢stanford,感谢原作者的翻译,我调整了一下代码格式,可以当做手册来用了,毕竟之前没怎么写过py 23333 **译者注**:本文[智能单元](https://zhuanlan.zhihu.com/intelligentunit)首发,翻译自斯坦福CS231n课程笔记[Python Numpy Tutorial](http://link.zhihu.com/?target=http//cs231n.github.io/python-numpy-tutorial/),由课程教师[Andrej …
Read More -
。。。哭了哦。。终于解决了这个bug 参考资料: libgfortran broken? libgfortran=3.0 should not be install with numpy <= 1.9 [SOLVED] libgfortran.so.3:cannot open shared object file: No such file [Replacing gcc-libs-libs with gcc-multilib arch conflict with gcc-libs and gcc-libs-multilib on latest update 一开始以为是anaconda相关。。。搞了半天。。。 然后又按照第一 …
Read More -
conda update anaconda 后提示 ValueError: unsupported format character ')' (0x29) at index 49 查到了这个:anaconda update issue I have narrowed this down to the following packages: package build psutil-1.2.1 py27_0 hard-link pycparser-2.10 py27_0 hard-link pykit-0.1.0 np18py27_2 hard-link pyparsing-2.0.1 …
Read More -
...先随便记录一下好了。。。 * 神经网络识别数字或者字母? * 识别车牌号? * not hot dog? 安装python pandas pandas 发现之前装caffe的时候...装了这个东西。。。 但是就是检测不到?于是卸载重装。。。。 需要注意的是,如果是python2,要用pip2 install pandas,如果是python3,要用pip3 install pandas. 安装tensorflow...直接sudo pacman -Syu python-tensorflow 即可。。。 然后装好之后检测不到orz...感觉还是pip的安装方式比较靠谱。。。 pip2 install tensorflow …
Read More