Нужен парсер который бы ходил по списку ссылок 1 строка один сайт, и чтобы вытягивал почты автоматом с сайта.Т.к. сайты немецкие, нужно чтобы он искал на сайте ссылку контакти или impressum в 99 там будет электронка которая так желанна.Если такие парсеры, так же было бы охуенно если бы можно было задавать минус слова и плюс слова если есть плюс слово то автоматом искать и сохранять почту если доступно, если плюс слова нет то либо сохранять либо нет, на выбор, чтобы дальше уже вручную смотерть те сайты которые парсер не смог пробить/или по мину словам они не подошли
>>78678 (OP)Это очень легко делается. Сколько платишь?
>>78685ты думаешь я знаю сколько это стоит? Ты предлагай цену если мне дешевле будет софтверно это сделать а не человека на зарплате держать то соглашусь
пиши на [email protected]
>>78730Чёт я передумал тебе помогать. Используй Content Downloader.
>>78678 (OP)блевок свой запостил, а почту не запостилпеши попробуем хули
>>79341написал карочhttps://yadi.sk/d/fjYcJbzbmKeVdскрипт бегает по ссылкам из txt, затем добавляет к ссылке /impressum/ и снова бегает, затем чистить говно и удаялет дублиurl.txt - закидываем список таргетовmail.txt - спаршенные мыласохраняет чутка мусора на выходе и похуй
>>79389лолблять! а нахуй он мне хочет все файлы в System32 удалить? лалка, ты бы не так палевно делала говновири
>>79449лоль какие файлы?кстате юзай лучше на openserver, на денвере нужно с включением curl дрючиться
>>79389ПАЦАНЫ НЕ КОЧАЙТЕ! Его скрипт качает на компутер вирус и запускает его! Всю папку виндоус мне снес!
>>79481сестра галоперидолу этомузы: пожелания к парсеру приветствуются
>>78730>ты думаешь я знаю сколько это стоит? Ты предлагай ценуЛолд. Я в таких случаях тупо называю максимум, а потом снижаю до порога, сколько клиет может заплатить максимум.Все верно - товар стоит столько, за сколько его можно умудриться впарить.
>>79485все верно, тоже пришел к такому выводуну не впарить ток, а адекватный ценник -не 20$за парсер думаю 200-400$ было бы норм(он бы мог в многопоточность, шариться по всем страницам сайта, наращивал бы самостоятельно базу таргетов и в нагрузку парсил бы телефоны, самостоятельно запускался - мож еще че придумали бы типо допольнительного парсига емейлов из whois и подобного)
v0.1 + мусора в mail.txt теперь не сохраняет+ удаляет повторные мыла (раньше дописывал в конец файла, теже мыла, только без дублей лоль)https://yadi.sk/d/HYz3f2WRmMhnL
>Как запускать скрипты на php?а) Хочу на домашнем компуктере 1. качаем ultimate http://open-server.ru/download/ 2. устанавливаете 3. заходите куда установили C:\OpenServer\ => запускаете Open Server x86.exe 4. жмем по появившемуся флажку в трее => запустить 5. закидываем файлы cкачанного парсера в C:\OpenServer\domains\localhost\ 6. набираем в браузере localhost/mail_parser v0.1/index.php ну или localhost/index.php если закидывали файлы без папки вы наверное сами догадались:) 7. profit Ах да, лучше использовать хотябы беслпатный vpn на всякий случай http://www.vpngate.net/en/howto_softether.aspx - кочаете клиент, там же инструкция по подключению, все просто да еще и бесплатно - слава аллаху.В парсинге нет ничего зазорного, но все же это серая фигня и свой мамкин ип лучше не светить в куче мест.б) Хочу на хостинге 1. легче купить хостинг за 1$ в месяц, но можно найти беслатный 2. как выбрать хостинг? например посмотреть спец разделы на сео форумах, типо... ололо... внимание... серча конечно же и подобных на хостинге в настройках php должен быть включен curl
>>79498>apt-get install php5>php -F path/to/file.php
>>79502>и так дети, что мы в видим?два сценария для командного процессора операционной системы linux (установка интерпретатора php и запуск скрипта)
Лень создавать тред, спрошу тут - спарсил сайт golocal.de, много фирм, тысячи их в формате название - адрес - телефон. Как эти базы можно использовать? [email protected]
Парсю немецкий mediamarkt, я нормален? Со мной всё будет хорошо?
>>79751>Парсер в битриксеТы че ебанутый? Ты че там делаешь?
>>79751нормален, а нах тебе этот контент?>>79754вниманиме вниманиенаписал,новый парсер (!) с краулером1) на входе берет список и переходит по внутренним ссылкам2) если находит ссылки на внешние ресурсы, добавляет их в список заданий - тоесть патом будет сам переходить и по ним, и на них также будет переходить по внутренним (и там тоже ищет ссылки сторонние ресурсы, ну вы поняли суть)вообщем может долго долго шариться по интернету и парсить себе базу/мыла/телефоны да что угодно автоматически расширяя базу для парсинга ^_^заметьте что код краулер гибкий, он не просто шарится по абсолютно всем ссылкам можно включить и такой режим, но - эффективность меньше, затраты времени/ресурсов больше, а бегает только по внутренним на 1 уровень вложенности (это очень оптимизирует работу и следовательно количество различных спаршенных ресурсов будет больше)мамкиным сириус бизнесменам продам недорого - [email protected]всяким неудачникам, лохам и нищебродам вышлю бесплатно :*
>>79785>>79389 --кун
>>79786точнее >>79492 --кунv0.2 же
>>79754Не, ну а чо, работает же и ладно.>>79785Делаем свои каталоги в дойчнете