-
再次迫于生计。。。 参考了面向新人的 Python 爬虫学习资料 大致的学习路线为: 一: 简单的定向脚本爬虫( request --- bs4 --- re ) 二: 大型框架式爬虫( Scrapy 框架为主) 三:浏览器模拟爬虫 ( Mechanize 模拟 和 Selenium 模拟) 有Python基础和一点html基础的话。。。貌似上手是0难度的 年轻人的第一个爬虫(虽然代码是直接copy的... ''' 抓取百度贴吧---生活大爆炸吧的基本内容 爬虫线路: requests - bs4 Python版本: 3.6 OS: mac os 12.12.4 ''' import requests import time …
Read More -
import os import math ave_err=0.0 max_err=0.0 max_err_rate=0.0 length=0 with open("cpu_result.txt","r") as fp1, open("cuda_ppl_result.txt","r") as fp2: for l1 in fp1: l2 = fp2.readline() l1=l1[:-2] l2=l2[:-2] lst = l1.split(' ') lst2 = l2.split(' ') #print lst lst = [float(x) for …
Read More -
记录一些常用的...总去查文档也是有点麻烦 * tensor.view 的作用是reshape 比如 a = torch.range(1, 16) 得到一个tensor that has 16 elements from 1 to 16. 在a=a.view(4,4)就得到了一个44的tensor。 需要注意reshape之后元素的个数不能改变(16==44) 参数-1的作用是,我懒得算这一维度应该是多少,(由于元素个数不能改变)所以希望自动被计算。**需要注意的是,只有一个维度可以写-1。 **不过view和reshape有些区别:reshape always copies memory. view never copies …
Read More -
先放一个同事安利给我的网站:regex101 查询匹配的中文字符unicode编码 正则表达式用于字符串处理、表单验证、日志数据分析等场合,实用高效。现将自己走网上搜索并总结的常用方法收集了一下: 匹配中文字符的正则表达式: [\u4e00-\u9fa5] 注:匹配中文还真是个头疼的事,有了这个表达式就好办了 匹配双字节字符(包括汉字在内):[^\x00-\xff] 注:可以用来计算字符串的长度(一个双字节字符长度计2,ASCII字符计1) 匹配空白行的正则表达式:\n\s*\r 注:可以用来删除空白行 匹配HTML标记的正则表达式:<(\S_?)[^>]>.?</>|<._? /> 注:网 …
Read More -
list = os.listdir(rootdir)#列出目录下的所有文件和目录 for line in list: filepath = os.path.join(rootdir,line) if os.path.isdir(filepath):#如果filepath是目录 print "dir:" + filepath else: print "file:" + filepath 如果需要遍历文件夹下的所以文件,可以使用os.walk()方法。 os.walk()返回一个三元素的tuple:当前路径、子文件夹名称、文件列表。 import os for root, dirs, files …
Read More -
原文链接 感谢stanford,感谢原作者的翻译,我调整了一下代码格式,可以当做手册来用了,毕竟之前没怎么写过py 23333 **译者注**:本文[智能单元](https://zhuanlan.zhihu.com/intelligentunit)首发,翻译自斯坦福CS231n课程笔记[Python Numpy Tutorial](http://link.zhihu.com/?target=http//cs231n.github.io/python-numpy-tutorial/),由课程教师[Andrej …
Read More -
。。。哭了哦。。终于解决了这个bug 参考资料: libgfortran broken? libgfortran=3.0 should not be install with numpy <= 1.9 [SOLVED] libgfortran.so.3:cannot open shared object file: No such file [Replacing gcc-libs-libs with gcc-multilib arch conflict with gcc-libs and gcc-libs-multilib on latest update 一开始以为是anaconda相关。。。搞了半天。。。 然后又按照第一 …
Read More -
conda update anaconda 后提示 ValueError: unsupported format character ')' (0x29) at index 49 查到了这个:anaconda update issue I have narrowed this down to the following packages: package build psutil-1.2.1 py27_0 hard-link pycparser-2.10 py27_0 hard-link pykit-0.1.0 np18py27_2 hard-link pyparsing-2.0.1 …
Read More -
...先随便记录一下好了。。。 * 神经网络识别数字或者字母? * 识别车牌号? * not hot dog? 安装python pandas pandas 发现之前装caffe的时候...装了这个东西。。。 但是就是检测不到?于是卸载重装。。。。 需要注意的是,如果是python2,要用pip2 install pandas,如果是python3,要用pip3 install pandas. 安装tensorflow...直接sudo pacman -Syu python-tensorflow 即可。。。 然后装好之后检测不到orz...感觉还是pip的安装方式比较靠谱。。。 pip2 install tensorflow …
Read More -
由于最近要做数字图像处理的大作业,以及之后一段时间,估计写python多一些,所以打算花些时间配置下vim. 1. 一键执行 其实之前一直有的。。不过没有效果,就没有管。发现问题是,python对应的filetype为"python",而不是"py" func! CompileRunGcc() exec "w" if &filetype == 'c' exec "!g++ % -o %<" exec "! ./%<" elseif &filetype == 'cpp' exec "!g++ % …
Read More