Home

bash下模拟group by功能

遇到这样一个问题:有一堆数据,需要统计相同key下相同的column的重复出现次数,实际上就是数据库里面的group by功能,但是建表导入然后计算未免麻烦,何况数据是临时数据,导入计算完毕之后就不需要了。这里用shell下的一些命令来完成。 数据格式 user tag_id type time AAAAAAAAAAA tag1 Click 2015:13:37:16 AAAAAAAAAAA tag1 Click 2015:13:37:16 AAAAAAAAAAA tag2 Click 2015:13:37:16 BBBBBBBBBBB tag2 Click 2015:13:37:16 BBBBBBBBBBB tag2 Click 2015:...

Read more

sort多列排序

遇到这样一个需求,希望按照第二列排序,第二列相同的情况下按照第一列排序,数据如下: b 2 c c 2 b a 1 b 习惯性的用: sort -k 2 -k 1 input.txt 输出结果是: a 1 b c 2 b b 2 c 可以看到实际上先按照第二列排序,第二列相同按照第三列排序了。问题在于sort -k默认是按照顺序排序到末尾的。如果要打破默认,需要指定从哪个列到哪个列。 sort -k 2,2 -k 1 input.txt 换个角度说,sort -k 1 -k 2 的效果跟 sort -k 1 是一样的。所以最好还是让数据按照排序列生成,这样看起来也最直观。

Read more

关于Django下获取checkbox的返回值

HTML中我们可以在form中这样写复选框: <form action="demo_form.asp"> <input type="checkbox" name="vehicle" value="Bike"> I have a bike<br> <input type="checkbox" name="vehicle" value="Car" checked> I have a car<br> <input type="submit" value="Submit"> </form> 但是作为服务端处理起来未免不变,尤其是checkbox list是自动生成的时候。此时可以用group方...

Read more

Python编码

众所周知Python的内码编码是Unicode,所有输入的编码都需要转换成unicode然后转出成为其他编码。Python2中存在unicode对象和str对象两种,在中文处理的时候很容易出问题,而Python3直接全部统一了编码到unicode。 举一个例子说明编码的转换,首先我们的环境是utf-8 LANG=zh_CN.UTF-8 LANGUAGE=zh_CN:zh LC_CTYPE="zh_CN.UTF-8" LC_NUMERIC="zh_CN.UTF-8" LC_TIME="zh_CN.UTF-8" LC_COLLATE="zh_CN.UTF-8" LC_MONETARY="zh_CN.UTF-8" LC_MESSAGES="zh_CN.UTF-8" LC_PAPER="z...

Read more

保存知乎日报到pocket

知乎日报是中国人民喜闻乐见的资讯类应用,Pocket是深受世界人民喜爱的阅读工具。鉴于反碎片化阅读的个人习惯,决定把散落在各个地方的有价值咨询集中到一个应用里面,于是有了如下的工具。 首先我们要parse知乎日报的URL。按照官方的说法每天三次投放,那抓一次就行了。直接用了sed工具。 curl -s http://daily.zhihu.com | sed 's/<a href="\(http:\/\/daily.zhihu.com\/story[^"]*\)"/\n\1\n/g' |grep 'http://daily.zhihu.com/story'

Read more

转载:生活不是眼前的苟且,生活有诗和远方——高晓松

“我妈说生活不是眼前的苟且,生活有诗和远方。我 和我妹妹深受这教育。谁要觉得你眼前这点儿苟且就是你的人生,那你这一生就完了。生活就是适合远方,能走多远走多远;走不远,一分钱没有,那么就读诗,诗 就是你坐在这,它就是远方。” 关于房子,我跟大多数人概念不一样。我从小住在清华校园里,家是那种二层的小楼,外表看起来很普通,面积也不是特大,但是特别安静。 这地儿都没动过,也没装修之说,从我生下来就是这样红色的,很老很旧。但我在那儿真觉得挺好,有一个家,但我在那儿真觉得挺好,有一个家,不仅仅是睡觉的 地方,我自己也不知道这房子多少年了,我们也在感慨:后边的院子多好啊,出门就是操场、游泳馆,还有漂亮的女生,白发的先生;四周的邻居,随便踹开一家的 门,里面住的都是中国顶级的大知识分子,进去聊会儿...

Read more

处理Django的自增字段

有时候需要手动构造一个Django model对象并保存,遇到如下的情况: model定义如下: class AuthHistory(models.Model): user_name = models.CharField(max_length=100, default=None) item_id = models.CharField(max_length=100) datetime = models.DateTimeField() url = models.CharField(max_length=1000) title = models.CharField(max_length=1000) operation = models.CharField(max_length=...

Read more

用maven执行java程序

Eclipse中需要执行一个java程序的之后只需要在入口类Run就行,但是有时候需要同时开两个程序,尤其对C/S模式的应用来说。针对这种情况,可以分如下三种方式启动另一个程序: java -cp 指定的类。shell(或者ZSH才有)下貌似是会有提示如下: ![](https://harrychen.oss-cn-beijing.aliyuncs.com/blog-images/2015/javacp.png) 以上方式至少需要保证用到的jar都在classpath中。 从eclipse中copy执行命令。去调试页面,查看刚才执行的command的属性页面。会看到如下界面,copy命令到shell中执行即可。 ![](https://harrychen....

Read more