bash下模拟group by功能
遇到这样一个问题:有一堆数据,需要统计相同key下相同的column的重复出现次数,实际上就是数据库里面的group by功能,但是建表导入然后计算未免麻烦,何况数据是临时数据,导入计算完毕之后就不需要了。这里用shell下的一些命令来完成。
数据格式
user tag_id type time
AAAAAAAAAAA tag1 Click 2015:13:37:16
AAAAAAAAAAA tag1 Click 2015:13:37:16
AAAAAAAAAAA tag2 Click 2015:13:37:16
BBBBBBBBBBB tag2 Click 2015:13:37:16
BBBBBBBBBBB tag2 Click 2015:...
sort多列排序
遇到这样一个需求,希望按照第二列排序,第二列相同的情况下按照第一列排序,数据如下:
b 2 c
c 2 b
a 1 b
习惯性的用:
sort -k 2 -k 1 input.txt
输出结果是:
a 1 b
c 2 b
b 2 c 可以看到实际上先按照第二列排序,第二列相同按照第三列排序了。问题在于sort -k默认是按照顺序排序到末尾的。如果要打破默认,需要指定从哪个列到哪个列。
sort -k 2,2 -k 1 input.txt
换个角度说,sort -k 1 -k 2 的效果跟 sort -k 1 是一样的。所以最好还是让数据按照排序列生成,这样看起来也最直观。
关于Django下获取checkbox的返回值
HTML中我们可以在form中这样写复选框:
<form action="demo_form.asp">
<input type="checkbox" name="vehicle" value="Bike"> I have a bike<br>
<input type="checkbox" name="vehicle" value="Car" checked> I have a car<br>
<input type="submit" value="Submit">
</form>
但是作为服务端处理起来未免不变,尤其是checkbox list是自动生成的时候。此时可以用group方...
Python编码
众所周知Python的内码编码是Unicode,所有输入的编码都需要转换成unicode然后转出成为其他编码。Python2中存在unicode对象和str对象两种,在中文处理的时候很容易出问题,而Python3直接全部统一了编码到unicode。
举一个例子说明编码的转换,首先我们的环境是utf-8
LANG=zh_CN.UTF-8
LANGUAGE=zh_CN:zh
LC_CTYPE="zh_CN.UTF-8"
LC_NUMERIC="zh_CN.UTF-8"
LC_TIME="zh_CN.UTF-8"
LC_COLLATE="zh_CN.UTF-8"
LC_MONETARY="zh_CN.UTF-8"
LC_MESSAGES="zh_CN.UTF-8"
LC_PAPER="z...
保存知乎日报到pocket
知乎日报是中国人民喜闻乐见的资讯类应用,Pocket是深受世界人民喜爱的阅读工具。鉴于反碎片化阅读的个人习惯,决定把散落在各个地方的有价值咨询集中到一个应用里面,于是有了如下的工具。
首先我们要parse知乎日报的URL。按照官方的说法每天三次投放,那抓一次就行了。直接用了sed工具。
curl -s http://daily.zhihu.com | sed 's/<a href="\(http:\/\/daily.zhihu.com\/story[^"]*\)"/\n\1\n/g' |grep 'http://daily.zhihu.com/story'
转载:生活不是眼前的苟且,生活有诗和远方——高晓松
“我妈说生活不是眼前的苟且,生活有诗和远方。我 和我妹妹深受这教育。谁要觉得你眼前这点儿苟且就是你的人生,那你这一生就完了。生活就是适合远方,能走多远走多远;走不远,一分钱没有,那么就读诗,诗 就是你坐在这,它就是远方。”
关于房子,我跟大多数人概念不一样。我从小住在清华校园里,家是那种二层的小楼,外表看起来很普通,面积也不是特大,但是特别安静。
这地儿都没动过,也没装修之说,从我生下来就是这样红色的,很老很旧。但我在那儿真觉得挺好,有一个家,但我在那儿真觉得挺好,有一个家,不仅仅是睡觉的 地方,我自己也不知道这房子多少年了,我们也在感慨:后边的院子多好啊,出门就是操场、游泳馆,还有漂亮的女生,白发的先生;四周的邻居,随便踹开一家的 门,里面住的都是中国顶级的大知识分子,进去聊会儿...
处理Django的自增字段
有时候需要手动构造一个Django model对象并保存,遇到如下的情况:
model定义如下:
class AuthHistory(models.Model):
user_name = models.CharField(max_length=100, default=None)
item_id = models.CharField(max_length=100)
datetime = models.DateTimeField()
url = models.CharField(max_length=1000)
title = models.CharField(max_length=1000)
operation = models.CharField(max_length=...
用maven执行java程序
Eclipse中需要执行一个java程序的之后只需要在入口类Run就行,但是有时候需要同时开两个程序,尤其对C/S模式的应用来说。针对这种情况,可以分如下三种方式启动另一个程序:
java -cp 指定的类。shell(或者ZSH才有)下貌似是会有提示如下:

以上方式至少需要保证用到的jar都在classpath中。
从eclipse中copy执行命令。去调试页面,查看刚才执行的command的属性页面。会看到如下界面,copy命令到shell中执行即可。
![](https://harrychen....
506 post articles, 64 pages.