Conectando o MySQL ao Apache nutch

Obtenha a fonte de https://mirror.nyi.net /apache//nutch/apache-nutch-1.2-src.zip

Abra org.apache.nutch.crawl.Crawl classe em seu editor.

Variável de pesquisa Path crawlDb = new Path(dir + "/crawldb");

A variável dará uma dica sobre onde substituir o código para obter seu próprio CustomMySQLCrawl classe.

A persistência está acontecendo durante esta chamada:crawlDbTool.update(crawlDb, segs, true, true); // update crawldb Portanto, é aí que você deve salvá-lo no banco de dados. Você pode querer considerar a integração do hibernate neste momento.