回复 7# mantis 的帖子
其实是垃圾爬虫,不守业内规则的胡爬,好在3000多个链接很少,页面也很小,不算攻击。 其实就是shell + php小技了。刚才仔细看了看,有的调配信息里没标注Flavoring的原味草(即第1列Flavoring),却在Rating里的Flavoring均值(即第2列Flavoring,草友对该调配品出来的调味程度)里有不低的值。
这是调配里本有调味但却未(忘或不详)录入的伪“原味”呢,还是草友品的不准确(有草友错误理解调味程度这个值)呢?
比如这款
http://www.tobaccoreviews.com/blend_detail.cfm?ALPHA=D&TID=1121 太感谢了,又是一份有用的HANDBOOK 多谢LZ,又可以瞎琢磨了~~~
转载:300种世界着名烟草索引
向高人致敬!转载另一位高人的“300种世界着名烟草索引”。
新人刚入门,学习中。 楼主兄全英文的,看不懂啊,能用翻译软件翻译一下不? 太感谢lz了! 这个必须谢! 稍微整理了一下,把草的成分分开了,这样用excel里筛选的功能更方便按成分组合挑出所需的烟草
另外请问piggy兄下次爬的时候有可能把评分的星级也爬下来吗?
[ 本帖最后由 蓝刃 于 2011-4-18 04:49 编辑 ]
回复 19# 蓝刃 的帖子
感谢蓝刃兄的整理,说实话,我excel用得不熟,第二排的下拉很方便!(我自己都是导入到数据库中,用SQL查;P )兄弟所说评分的星级,是指的把那些对星级的文字描述,替换为友好些的☆么?
实际上,为了好排序,我自己做了一个对应转换
Strength
Extremely Mild 1
Very Mild 1.5
Mild 2
Mild to Medium 2.5
Medium 3
Medium to Strong 3.5
Strong 4
Very Strong 4.5
Extremely Strong 5
Flavoring
None detected 0
Extremely Mild 1
Very Mild 1.5
Mild 2
Mild to Medium 2.5
Medium 3
Medium to Strong 3.5
Strong 4
Very Strong 4.5
Extra Strong 5
Taste
Extremely Mild (Flat) 1
Very Mild 1.5
Mild 2
Mild to Medium 2.5
Medium 3
Medium to Full 3.5
Full 4
Very Full 4.5
Extra Full 5
Overwhelming 5.5
Room Note
Unnoticeable 0
Very Pleasant 1.5
Pleasant 2
Pleasant to Tolerable 2.5
Tolerable 3
Tolerable to Strong 3.5
Strong 4
Very Strong 4.5
Overwhelming 5.5
Recommendation
Highly Recommended 4
Recommended 3
Somewhat Recommended 2
Not Recommended 1
最后这个就是总的评分星级吧?(由于怕误解,所以我没有发布转换后的xls)