Installation of ir kernel

> jupyter kernelspec install –name ir E:\C_ext\site-library\IRkernel\kernelspec

Posted in Python, R | Comments Off

通过grub rescue恢复启动

系统:Windows8和Ubuntu 14.04双系统。
症状:在Windows下修改过硬盘分区后直接进入grub rescue
解决方法:
1. 通过ls命令寻找boot分区所在位置

ls
ls (hd0, 5)/boot
ls (hd0, 6)/boot

在我的机器上,所在分区为(hd0, 6)
2. 通过grub2 rescue启动

set prefix=(hd0, 6)/boot/grub
set root=(hd0,6)
insmod normal
normal

3. 进入Linux以后,更新并安装grub

sudo update-grub
sudo grub install /dev/sda

4.更新/etc/fstab,通过blkid命令更新相关分区的UUID

blkid

Posted in Linux | Tagged | Comments Off

如何有效对文献内容进行管理

一年多以前,Yip和我就开始讨论使用定性分析软件对文献进行内容管理。比如可以用主要发现、控制变量、主要理论观点、作用机制等作为编码,集中汇聚文献的相关内容。机缘巧合,后来碰到了PDF Clown,于是通过开源的方式做到类似的事情。于是,RQDA现在可以作为文献内容管理的工具。简要的使用说明可以在此下载

Posted in R, 未分类 | Comments Off

Jython在中文版windows 7的问题

Jython的控制台无法正常地对字符进行解释,比如
>>> mystr = “hello world”
….

经过Google、Baidu以及自己的试验,最好的解决方法是修改registry文件。
该文件有一行设定控制台编码,
# python.console.encoding = cp850
取消注释,变成:
python.console.encoding = cp850

重新启动Jython控制台就可以了。

Posted in Python | Comments Off

rmmseg4j 0.2-0 发布

主要变化是对自定义字典的处理更加自动化,当字典变化的时候,字典更新。

Posted in R | Comments Off

rmmseg4j 0.1-0 在CRAN上发布了

特性:
1、实现三种分词方法的接口。
2、支持自定义字典。

见: http://cran.r-project.org/web/packages/rmmseg4j/index.html

Posted in R | Tagged | Comments Off

rmmseg4j能使用自定义字典啦

> library(rmmseg4j)
> mmseg4j(“不喜欢”,dicDir=”c:/”)
[1] “不 喜 欢”
> con=file(“c:/wordsxxx.dic”,encoding=”UTF-8″)
> writeLines(“喜欢”,con)
> close(con)
> mmseg4j(“不喜欢”,dicDir=”c:/”)
[1] “不 喜 欢”
>
> ## reload dictionaries so wordsxxx.dic is actually used
> mmseg4j(“不喜欢”,dicDir=”c:/”,reload=TRUE)
[1] “不 喜欢”
>
> ## dictionary changed
> con=file(“c:/wordsxxx.dic”,encoding=”UTF-8″)
> writeLines(“不喜欢”,con)
> close(con)
>
> ## changed dictionary is not used yet
> mmseg4j(“不喜欢”,dicDir=”c:/”,reload=FALSE)
[1] “不 喜欢”
>
> ## changed dictionary is used
> mmseg4j(“不喜欢”,dicDir=”c:/”,reload=TRUE)
[1] “不喜欢”

Posted in R | Tagged | Comments Off

使用R进行中文分词

两个中文分词的R接口(rsmartcn和rmmseg4j)终于又重新上线啦。
1、对文档进行完善,使其通过R的检测。在写文档的时候发现,如果文档含有中文,加入encoding这一个设置可以通过R的检测,但是在通过latex生成PDF的时候还是会出问题。目前暂时的解决方法是将这些含有中文的命令放在demo里面去。
2、现在的接口可以直接以中文的string vector作为输入。
3、rmmseg4j现在提供了complex和maxword的两个分词方法的接口。

> library(rsmartcn)
Loading required package: rJava
> demo(smartcn)

demo(smartcn)
—- ~~~~~~~

Type to start :

> smartcn(“这是一个中文分词软件”)
[1] “这 是 一个 中文 分词 软件 ”

> smartcn(c(“这是一个中文分词软件”, “这是一个测试”))
[1] “这 是 一个 中文 分词 软件 ” “这 是 一个 测试 ”
> library(rmmseg4j)
> demo(mmseg4j)

demo(mmseg4j)
—- ~~~~~~~

Type to start :

> mmseg4j(“这是一个中文分词软件。”)
[1] “这是 一个 中文 分词 软件”

> mmseg4j(“中国人民银行。”)
[1] “中国人民银行”

> mmseg4j(“中国人民银行。”, “maxword”)
[1] “中国 国人 人民 银行”

> mmseg4j(c(“这是一个中文分词软件。”, “中国人民银行。”))
[1] “这是 一个 中文 分词 软件” “中国人民银行”

Posted in R | Tagged | Comments Off

在照片中增加文字

功能:默认在照片的右下角增加问题。
软件:Pyhon的PIL库。
注意:以下代码的缩进被博客忽视了。

def addText(file, string):
import Image, ImageDraw, ImageFont
im = Image.open(file)
size = im.size
format = im.format
draw=ImageDraw.Draw(im)
font = ImageFont.load_default()
txtSize = draw.textsize(string, font=font)
x = size[0] - txtSize[0] - 10
y = size[1] - txtSize[1] - 10
draw.text((x,y), string)
im.save("%s_new.%s" % (file, format), format)

使用方式:对C:/Phone.jpej照片增加“Photo by Ronggui”的字样,可以使用如下命令

addText("c:/Phone.jpej","Photo by Ronggui")

Posted in Python | Comments Off

我的sysprofile.do设置

local bdir:sysdir STATA
sysdir set PLUS “`bdir’/ado/plus”
sysdir set PERSONAL “`bdir’/ado/personal”
sysdir set OLDPLACE “`bdir’/ado/oldplace”
local bdir
** 这样的话,所有自己安装的ado文件都放置在Stata安装的文件夹内,使得Stata更加portable。

Posted in Stata | Tagged | Comments Off