标签:
commoncrawl 源码库是用于 Hadoop 的自定义 InputFormat 配送实现。
Common Crawl 提供一个示例程序 BasicArcFileReaderSample.java (位于 org.commoncrawl.samples) 用来配置 InputFormat。
commoncrawl 源码库是用于 Hadoop 的自定义 InputFormat 配送实现
标签:
原文地址:http://www.cnblogs.com/x113/p/4719835.html