Taka stronka: https://github.com/Iskratgz/mapReduce/blob/master/docs/wbzyl.md
"Akapity ze wszystkich książek zapisano w formacie TSV w pliku gutenberg-books.tsv".

Później z pliku tworzona jest kolekcja z dokumentami.

Tylko pytanie jak mając link: https://www.gutenberg.org/ebooks/2638 lub https://www.gutenberg.org/files/2638/2638-0.txt wrzucić to do tsv, albo bezpośrednio do kolekcji mongodb.

mongoimport ma parametr uri, ale chyba nie do ściągania plików.

Na podanej stronce jest odniesienie do get-books.sh, ale link jest martwy :(