Google Reader获取Feed全文输出的Chrome插件

最后更新:2010-01-12

自从Chrome 4.0 Dev版本支持插件机制后,终于找到了这个Read More! for Google Reader插件,实现GReader下的Feed全文抓取功能。Firefox下早就可以通过Greasemonkey + google reader full feed changer脚本实现这个功能,而Chrome下这个Read More!似乎就是唯一的选择了。

配置很简单,URL Pattern用来匹配站点地址,Content XPath/CSS Selector用来匹配全文内容所在的div标记。Read More!插件的介绍页面相当简单,也没有实际的使用说明。不过基本上可以参照插件内建的cnbeta配置改写。

以下是我用到的几个:

说明 URL Pattern Content XPath/CSS Selector
CB IT新闻 http://www\.cnbeta\.com
//*[@id=’news_content’]/div[@class=’digbox’]
/preceding-sibling::node()
国家地理每日一图中文 http://my\.dongua\.com\/ngpod //div[@class=”cont cs-output”]
Universe Today http://www\.universetoday\.com //div[@class=”post”]
财经网每日要闻 http://www\.caijing\.com\.cn //div[@class=”artical”]
经济观察 – 观察家 http://www\.eeo\.com\.cn //div[@id=’text_content’]
中金在线财经频道 http://news\.cnfol\.com //div[@class=’content’]
     

关于Google Reader中Feed管理的一些想法

最后更新:2009-09-21

自从把RSS阅读器从Bloglines换成Google Reader以后,真的是越用越顺手,越用越喜欢。也不止一次在不同场合向别人推荐过。这个帖子主要说一说我在Google Reader中关于Feed管理的一些体会和想法。

Google Reader的好处

GR的好处其实不需要多说。我理解它首先是一个RSS阅读器;其次它是一个RSS内容管理、内容发现的工具。内容管理包括怎样有效地发现有价值的内容,避免信息过载,标记和搜索已阅的内容等等。而内容发现则包括怎样在自己订阅的内容之外发现有价值的Feed,好友的分享源等等。Google Reader本身只是个工具,关键是怎样用好它。最后,在今年GR升级以后,开始具备了社交化网络(SNS)的功能。与开心001,豆瓣这些网站的SNS功能不同,Google Reader是基于阅读的SNS,是很适合有阅读习惯的人群的。

关于Feed管理

也许有不少人和我一样,订阅的Feed太多,以至于根本读不过来,很多分类下的未读条目动不动就1000+,典型的信息过载 。这个时候请一定记住:DON’T PANIC! 下面就是我的方法。

  • 同时采用按类别与按阅读频率对Feed进行分组

按类别是最常用的,相信每个人都有各自习惯的分类法。例如经济类、政治类、文化类、科技类等等,又或者名人blog,好友blog,官网blog等等。而GR中的分类(我用的英文版里叫Folder)其实是tag,也就是说同一个Feed可以同时标记为两个或更多的分类。

我的方法就是在传统的分类之外,加上一个阅读频率的分组,例如freq_0,这个分组表示自己最常看的一类Feed。另外再建一个freq_1分组,表示相对freq_0阅读频率要低一些的Feed。而保持有效阅读,避免信息过载的关键就在于:根据阅读频率迭代性地调整Feed的频率分类。

举个例子:假如freq_0分类下的Feed我每天都会看,而freq_1分类下的Feed每周才去看一次。这样当新订阅一个自己感兴趣的Blog时,除了设置传统的分类,我还会根据其内容的价值设置到对应的阅读频率分组。如果一段时间以后,自己的兴趣转移,或者这个Blog本身内容有所下降时,就降低它的阅读频率分类,从freq_0到freq_1。与此同时定期对阅读频率最低的Feed清理、退订。另外,可以根据自己的需要设置更多的频率等级,如freq_0到freq_3。但对我来说,两级已是完全够用。

  • 保持一定的Feed淘汰率

只订阅,不退订是信息过载的主要原因。事实上,GR只是个阅读工具,真正的重点永远在于阅读本身。过多的Feed不仅看不过来,也容易造成阅读时走马观花的坏习惯。说实在的,与其每天1小时把未读内容都看一遍,还不如退订几个阅读收获不大的Feed,然后抽时间把以前读过而且觉得有价值的文章找出来再读一遍(这个在文章评级部分还会再讲)。

具体说淘汰的方法。我目前用到的有这么几条原则:

a)从阅读频率最低的分组(freq_1)里定期淘汰;
b)优先淘汰更新频繁且价值有限的Feed。因为这样意味着更低的信噪比;
c)优先淘汰不能提供全文输出的Feed。每次都要点击“阅读全文”实在是种时间浪费;
d)利用GR首页提供的What’s new进行随机的淘汰。解释一下,GR首页的默认设置是Home(如果没有自己改过设置的话),这个页面会从你所有订阅的Feed中随机(应该也不是完全随机,和你最近的订阅内容以及阅读内容有关)挑选几个有内容更新的显示出来。这个时候如果首页显示的总是你不大去读的Feed,不用犹豫,退订吧。

  • 关于文章的评级与分享

Star,Like,Share我最初也没有什么区分,看到一篇好文章总是又加星,又点Like又Share。而这样的三倍点击完全没有意义。这三者最大的区别就在于,他们的可见对象是完全不同的。Star是给自己看的,Like是给陌生人和好友看的,Share只是给好友看的。

在谈我的对他们三个的区分之前,想先岔开话题说下豆瓣上我对电影的评价标准。其实好电影4星和5星是很难分的。我的标准是这样,如果这部电影对于没看过的人值得推荐,那就是4星;若在此基础上自己还打算找时间看第二遍,那就是5星。当然,这里的区别还是很微妙。总的来说,并不因为知晓剧情而降低观赏价值的,就对得起5星啦~ 😀

再回过头来说我对于Star,Like和Share的区分:

Star:Star就是文章里的5星标准,是值得自己重读第二遍的文章;
Like:表达一种最一般的喜欢,顺手“顶”一下,“digg”一把,“支持”一下的意思;
Share:4星+5星的内容。不过这个标准我还心存犹豫,因为如果好友增多的话,很容易看到大量相同的文章被共享。也许有必要把Share的标准提高一些。(这个在好友管理部分中再讲)

  • 关于People you follow

也是从今年的那次更新开始,Google Reader中的文章分享变得更加开放。最初只能向Gmail的联系人或者Gtalk好友分享文章,在更新之后,可以去follow一个陌生人的文章分享列表。一般可以通过这么几种方式查看并Follow陌生人的shared item:

a)直接访问对方的文章分享页面,左上方会有Follow按钮。例如我的文章分享页面URL是  https://www.google.com/reader/shared/unicell
b)访问对方的Google Profile页面。很多编辑过自己Google Profile的用户都会列上GR的分享页面地址;
c)通过某一篇blog文章点like的用户列表。如果某一篇文章你很喜欢,而恰好也有另一个用户也点了like,那么有兴趣,可以不妨探索下他的share items看看;

是否要Follow一个人,以及Follow之后是否需要Unfollow,也是需要有所考虑的。基本上,我既希望通过Follow别人来获得我所不知道的高质量内容,又希望避免因此可能会产生的信息过载。下面是我关于Follow/Unfollow的一些想法:

a) 和管理Feed一样,如果某个人的分享列表中你感兴趣的内容低于一定的比例,则不用Follow,已经Follow的Unfollow之;
b)避免去Follow内容来源过于单一的人。内容来源过于单一(总是分享某个Blog的内容)有一个严重问题——如果这个Blog本身的内容很有价值的话,我为什么不直接去订阅那个Blog呢?当然,有一种可能是你Follow的这个人可以帮你做初步的筛选。但基于人们的阅读兴趣不可能完全一致,如果他不能做到筛选后的你都喜欢,那还不如自己直接订阅原始的Blog;
c)避免Follow和自己已订阅Feed重复的人。这也是一种阅读时间的浪费,因为你已经读过内容,在你Follow的人那里又会读到一遍,然后在Follow的另一个人那里又会读到一遍。实在很奔溃。。。这也是之前提到我质疑自己Share标准的一个问题。如果4星和5星的都share,很容易造成大量重复内容。也许在可推荐与必须推荐之间,应该取上限值;
d)倾向于Follow自己本身也写Blog,而且内容不错的人。 因为这往往意味着这个人是有观点的,是有审美力的,他们share的东西往往是值得一读的。事实上,从实践来看,这个方法相当有效。
e)倾向于Follow能从高质量内容源中过滤再分享的人。例如科学松鼠会TEDtoChina 牛博网这些内容都相当不错,可是往往每篇的内容较长。如果能Follow定期阅读高质量内容源的人,往往不会错过精彩的内容;

其余

最后,和Google Reader有关几点想说的是:

  1. https访问是王道。https://www.google.com/reader/view/ 访问起来稳定而且安全;
  2. Google Reader再强大,也代替不了真正的书。毕竟后者要丰富、完整的多,是一手内容的主要来源;
  3. 上面说的这些方法不太适用于朋友的Blog和Share items。在这种情况下,了解朋友的近况和状态才是阅读的目的。

全面投向Google

logo1_thumb7.png 短短的两天Google Reader试用,决定放弃最后一个非Google产品——Bloglines

 从最早的FeedDaemonMyIE2浏览器自带的订阅功能,再到Bloglines和Google Reader,前后一共四种RSS阅读器。初识RSS订阅,是从一篇FeedDaemon的介绍文章开始的,自然也就用上了。但很快便觉得浏览器之外再开一个客户端有些累赘,于是转投Maxthon(MyIE2)浏览器自带的订阅功能。从同学那里了解到Bloglines后,一下便发现了它的好处:

  1. 是Web服务,在任何一台机器、任何一个浏览器上登陆都可以读到自己订阅的feed;
  2. 通过第三方访问feed,可以读到直接不能访问的blog。这一点相比Maxthon实在好太多,同时也有速度的提升;
  3. 多数网站提供了Bloglines的订阅按钮,很方便;
  4. 提供多种阅读方式,包括列表方式的标题阅读和rss内容的直接阅读。

Bloglines的粉丝做了两年多,中途Google Reader推出时也曾试用过。当时觉得Reader并没有什么特别的地方,而且把订阅的几百条feed导入Reader也很费事(Google Reader读取Bloglines导出OPML有些问题),于是按兵不动。然而最近这几条理由终于促使我告别Bloglines:

  1. Bloglines本身的问题。有些feed总是莫名其妙出现以前的旧文章。一开始以为是所属的blog重新做了发布,或生成索引(就像我用的blogger一样)导致出现重复更新,可如果这样的话绝不会孤零零地更新出几篇数月以前的文章。Google一下发现果然是Bloglines的问题。唉,不争气的bloglines啊。。。
  2. Bloglines针对每一条feed单独设置阅读模式(Titles/Summaries/Complete Entries),这一点上不如Google Reader灵活。后者List View/Expanded View是全局的阅读模式选择,切换相当方便。事实上,对于我而言,这种切换操作相当频繁;
  3. Bloglines一旦点中一条feed,更新的内容会全部显示并设为已读。这时无论你是否读完,这些内容下次就不会再显示了。这一点Google Reader的设计要好很多,是否已读可以自动设也可以手工选,绝对不会出现明明只读了标题下次就再找不见内容的情况;
  4. Google Reader提供了star/share操作,可用于标记好的文章或与别人分享,这样看过的优秀内容再不会石沉大海了。在自己的blog中加入脚本,还可以动态显示自己分享的文章(看我blog的左边^^);
  5. 已读过条目在Google Reader中仍可以显示。不仅如此,只要滚动条向下走,就可以读到更早的条目;
  6. Google开始收集越来越多的个人信息了。gmail收集邮件信息,bookmarks收集书签信息,web history收集网址信息和关键词搜索信息。。。另一方面,它也试着根据这些信息给出越来越多的个性化服务,例如iGoogleInteresting Items For You模块。如果像我一样并不反感这种个人信息收集的话,不妨提供给它更多的信息吧,例如rss订阅。

我相信,用户选择的转变不会是突然的。习惯促使我们做出早已熟悉的那个选择,然而最终让用户改变习惯的无非便是两样东西:不愿将就的缺陷,以及充满诱惑的新功能。

update: 2007-05-23

另外再补充几点:

  1. Google Reader的share功能,可以针对具体一篇文章,也可以对某一个tag。就是可以将标记为某个tag的文章全部设为共享。而相比之下,bloglines只能选择将订阅的全部feed共享;
  2. Google Reader提供的Personalized Trends相当有意思,可以看到自己阅读数目的统计,feed更新频率的统计等等;
  3. 之前觉得Google Reader有个缺点:阅读窗口太小。不过今天发现可以通过u键关闭左侧的导航栏,很方便!

从10亿光年到0.1费米,一些关于Google的用户体验,一点有关中英文信息的感慨

GF转给我一篇从10亿光年到0.1飞米,看完之后很是震撼。一直以来总认为,”高度”能使人悲悯,却没想到”距离”除了能使人陌生,也同样能使人产生这样的感情。

悲悯之余,就有点好奇,想知道这样的好帖究竟出自哪里? 转贴没有标明出处的,只好Google。震撼、经典、推荐–这样的字眼一而再,再而三地出现,可就是找不到文章的原作者以及出处。最后在一篇Blog中见到了英文标题From 1 billion light-years to 0.1 fermi,才算找到了开启Google大门的钥匙。

在Google中搜从10亿光年到0.1飞米,共有4560条记录;纠正错别字后再搜从10亿光年到0.1费米,仅有区区49条记录(这其中真正和这篇文章相关的只有不到5条);再搜From 1 billion light-years to 0.1 fermi,发现只有362条记录,而且基本都是不相关的内容,这才意识到,那篇Blog是在转载时根据汉语翻译过来的,它发布于05年11月9日,也晚于我见到的10月份的这一篇。重新使用light-years fermi做关键词,找到了原文章的关键词powers of 10

以上就是通过Google查找原作者的全部过程,然而故事却并未就此结束。

查看powers of 10的搜索记录,我很惊讶的发现,这里面不仅有、有网页、有wiki条目、有Java做的交互式教程,甚至还有电影展览。唔。。。还有官方网站

原来Powers of Ten是1978年由Charles和Ray Eames拍摄的一部十分钟的短片,向我们展示了宇宙在不同尺度上迥异的面貌。该片在1998年入选美国国家电影保护局的名单(National Film Registry,美国国家电影保护局每年评选25部上映满10年,美国出品,且在文化、历史、艺术等方面有重大影响的影片)。这部影片的科学顾问是Philip Morrison和Phylis Morrison夫妇。Philip Morrison是MIT的物理教授,原子弹的发明者之一,他早年的一篇论文指出了用微波进行空间通讯的可能性,从而导致SETI计划的实施(Philip Morrison教授的My 40 Years of SETI)。Powers of Ten这本书就是根据电影改编的,书中记录了42张大小相差10倍的图片,也就是一开始那篇帖子的由来。

问题的关键就在于,这样一本优秀的科普书籍在中文世界和英文世界有着两样的境遇。一、由物理大师所写的名著,同名电影入选了电影保护局的名单,影响了诸多读者,在国内bbs转贴时却根本见不到作者和出处;二、在各大站点转载时内容完全雷同,甚至连错别字都没有纠正,而在英文的搜索结果中,却很少见到相同的内容。不仅如此,还有很多衍生的内容,比如其他版本的powers of ten,还有Quarks to Quasars

谁能告诉我,这是为什么?

其余链接:
POWERS OF TEN BIBLIOGRAPHY
COSMIC VIEW: The Universe in 40 Jumps

Technorati : , ,