关于个人数据管理的一些想法
数字时代,个人数据不仅作为工作上的产出,更成为一种生活的记录。随着数据量的增加,怎样进行有效的管理其实真的是一个值得讨论一番的问题。以下是我的一些想法:
方法论
- 区分个人生成数据和个人收集数据
前者主要是指自己编写的文档、记录的笔记、各种个人创作的文件等。这类个人生成数据的特点是较为珍贵,一旦丢失很难找回;而另一类个人收集数据,主要是指经过个人分类、整理、阅读的文档和数据。这类数据的特点是经过二次处理。原始数据往往能在最初的位置或互联网上获得。附加值在于经过个人阅读、整理所做的分类和标记等。
区分个人生成数据和个人收集数据的主要目的在于两者的重要性不同,需要区别对待。此外,除去两者共同的备份需求之外,前者更加侧重于数据的可管理性、可维护性,而后者往往侧重于分类和检索的便利。由于这个区别,个人生成数据应尽量从个人收集数据中剥离开,单独管理。例如:所做笔记和收集的资料相互分开,采用引用、链接等形式剥离出笔记、评论而避免在原始资料中嵌入个人笔记等等。
- 成本收益取舍
无论如何,对自己的数据做管理总会需要额外的时间和精力。除去实际管理和维护的时间成本,了解并选用适合的工具,探寻新的数据管理形式,全都需要额外时间和精力的投入。这里就涉及到成本收益的比较问题。假如为了追求细致的分类,便捷的控制而销毁了过多的时间和精力,也就本末倒置了。从这一角度想,秘书的存在其实也是个人数据管理的手段之一。
- 迭代式的数据管理
管理个人数据需要考虑成本和收益,自然也就引出了迭代式管理的想法。先用现有、可行的手段维护好自己的数据,在这个过程中逐渐地细化分类、重新组织、优化内容等。当一种新的工具和管理方法出现,采用后如果在现有数据规模的基础上,可以获取大于成本的收益时,则考虑升级开始下一轮的迭代。
经验记录
- 文档和笔记
利用svn(subversion)做版本控制。这样做的好处在于:不限制文件类型(文本文件、office文档或各种数据文件都可以管理),服务器的数据备份,多台电脑(如公司和家)之间的数据同步。相对于流行的git、hg等分布式管理工具,个人觉得svn更适于管理个人文档和数据。主要是因为svn完全按照文件夹方式操作,这样在一个新的工作环境中使用时,可以根据需要只同步全部个人数据中一个子分类,而非全部。
- 书签
使用Chrome浏览器的书签同步功能。最早的时候,我也是一直用svn来管理全部书签的。那个时候MyIE(后来的Maxthon)还没有出来,用的是一个iWander的多窗口浏览器。svn管理书签不仅可以同步URL信息,还记录了访问次数,最爱书签之类的信息。之后,导出了一部分书签存放在del.icio.us。这两种方法在使用Chrome的Bookmark Sync后完全弃用。
- 简单笔记(随手记录)
采用Evernote进行管理。 Evernote是基于云存储的笔记工具,提供了跨平台的客户端(Chrome插件,Windows客户端,iOS客户端,Android客户端等)。免费账户提供每月60MB的上传量。非常便于随时随地做些记录。但由于这类工具的导出格式往往很难再次利用,所以只在Evernote上存放相对次要的内容。
- 个人收集类数据
这类数据往往量大,但时效性有限 ,经过一段时间后就很少访问。一种方法是在个人的服务器上统一存档,定期备份;对特定文档,也可以考虑采用云存储工具进行备份。目前Box.net免费提供50GB容量,但缺点是不提供同步工具。因其定位于企业市场,且更侧重基于数据的分享和协作,而非同步;Dropbox非常便于各种设备间的数据同步,通过邀请最高可达18GB容量,但国内访问受限;Windows Live Mesh有5GB的免费容量,但不支持iOS和Android客户端,且Windows系统要求为Win7。用Amazon的S3做数据备份,比较适合一经上传访问较少的场合。数据安全可靠,但价格仍然偏高。
- 阅读的文章
以前采用Google Reader(见关于GReader中Feed管理的介绍)进行阅读文章的标记和管理。这部分管理在Google Reader最近改版砍掉全部原有share机制后,暂未找到替代方案。
- 个人数字资产
采用类似Death Switch(介绍)的服务进行管理。 主要是考虑发生意外情况下,各类帐号、密码等数字资产的继承和转移。
- 博客
相对于以上各种被动式手段来说,博客是一种主动式内容管理工具。它的数据管理出发点不是“保存”,而是“发布”和“传播”。当然,博客本身就是一个很好的内容管理工具,但适用的内容需要相对完整和成型。