Spider PDF : Le concept...
La première phase du projet consiste à mettre en place un moteur de recherche rapide et robuste de fichiers PDF.
Le crawler de Spider France est en charge de chercher de nouveaux sites français alors que celui de Spider-PDF va se focaliser sur le recherche de fichiers.
Viens ensuite un long processus de convertion au format image, html des fichiers trouvés ainsi que l'indexation pour permettre une recherche efficace.
Pourquoi ne pas avoir choisi d'utiliser une API quelconque (Google, Yahoo, ...) ?
Tout simplement parce que nous souhaitions avoir une grande souplesse sur les conversions, sur l'algorithme de classement des documents ainsi que la présentation des listes de résultat.
La seconde phase de ce projet consiste à classer les documents dans votre bibliothèque. En créant un compte utilisateur (en cours de développement), vous pourrez classer les documents comme bon vous semble et les retrouver facilement.
Les fichiers PDF à découvrir...
-
-
-
futurfr.pdf
www.insa-toulouse.fr
Résumé en cours de création pour ce fichier PDF
|
|
-
-
-
-
-
Le top 100 des recherches de fichiers PDF :
Spider PDF : Notre partenaire...
Spider PDF se base sur la base de données du moteur de recherche Spider France pour crawler des sites français.
Les différents points abordés sur Spider France :
- Vos principaux mots-clés
- Votre référencement : PageRank, Backlinks, indice FR, ...
- Historique de PageRank : les variations du PR en fonction du temps
- Les réseaux sociaux
- Votre adresse : l'adresse de la société propriétaire du site
- La concurrence : les sites en concurrence avec vous sur vos mots-clés
- Les fichiers : les fichiers PDF, RSS et MP3 présents sur votre site
|
|
|