Mechanize-Ruby – вопросы и ответы

63
голоса
1
ответ
У меня есть HTML-структура такой страницы, <form align="center" method="post" name="form1"> <input type="hidden" value="J0512-0491" name="jobid"> <input type="hidden" value="1" name=...
4 месяца, 4 недели назад Mansoor Elahi
117
голосов
1
ответ
Я хочу щелкнуть объект html на основе заголовка <a class="class_id" style="background: url("http://cdn.server.net/Img/openid/openid-logos.png?v=8") repeat scroll -1px -518px rgb(255, 255, 255);"...
4 месяца, 4 недели назад Radek
88
голосов
1
ответ
Я пытаюсь пропустить обработку нескольких больших страниц (более 10 МБ), разбросанных в результирующем наборе, так как Mechanize (версия 2.7.3) сканирует массив ссылок. К сожалению, я не могу найти...
5 месяцев назад odlp
77
голосов
1
ответ
Чтобы зарегистрироваться, чтобы загрузить PDF файл, у меня есть код, который отлично работает на ruby, когда я отлаживаю. Проблема в том, что когда я пытаюсь использовать этот код в приложении Rail...
5 месяцев назад Ruby_Beginner
89
голосов
1
ответ
Я пытаюсь очистить некоторые данные, используя библиотеку механизации в рубине, и я должен сначала пройти страницу "Условия использования". Для этого я нажимаю кнопку "Я согласен". require 'mechani...
5 месяцев назад Hugh Stimson
99
голосов
1
ответ
У меня есть URL-адрес, с которым я не могу получить доступ с помощью Mechanize, и я не знаю, почему: # Use ruby 2.1.6 require 'mechanize' require 'axlsx' # 2.0.1 require 'roo' # 1.13.2 mechanize = ...
5 месяцев назад Ismael Bourg
99
голосов
1
ответ
Я могу выполнить запрос HEAD с Faraday (Faraday.head url), но я использую Mechanize в своем текущем проекте. Я хотел бы получить значение из заголовка (имя файла) без загрузки файла. Оказывает ли "...
5 месяцев, 1 неделя назад JP.
77
голосов
1
ответ
Я пытаюсь выяснить, отправляет ли механик правильный почтовый запрос . Я хочу войти на форум (см. html source, logize log в моем другом вопросе), но я снова получаю только страницу входа. Когда я с...
5 месяцев, 1 неделя назад Radek
77
голосов
2
ответа
У меня есть страница, которая входит в форму. После входа в систему есть несколько переадресаций. Первый выглядит следующим образом: #<Mechanize::File:0x1f4ff23 @filename="MYL.html", @code="200"...
5 месяцев, 1 неделя назад user1198316
89
голосов
1
ответ
Как получить описания страниц с помощью Mechanize? Жемчуг Pismo обладает такой функциональностью, но хуже, чем драгоценный камень Mechanize . Например, механизировать находит теги изображений. Я не...
5 месяцев, 1 неделя назад Luccas
116
голосов
1
ответ
Я пробовал искать ответы на другие темы, но не хотел, чтобы ответы были релевантны моей ситуации (извиняюсь, если это не так). Тем не менее, я пытаюсь запустить простой рубиновый скрипт в irb > ...
5 месяцев, 1 неделя назад javiwins
117
голосов
1
ответ
Используя следующий код (с сайта Mechanize, но в грабли). namespace :ans do task :grab => :environment do a = Mechanize.new { |agent| agent.user_agent_alias = 'Mac Safari' } begin a.get('http://...
5 месяцев, 1 неделя назад iOSDevil
118
голосов
1
ответ
Я пытаюсь обновить эту страницу, нажав кнопку, которая находится за пределами любых форм, используя Ruby Mechanize. Кто-нибудь знает возможно ли это? Я знаю, что я не могу использовать стандартную ...
5 месяцев, 2 недели назад arc
158
голосов
1
ответ
Я написал простую функцию, которая обрабатывает выборку URL: def tender_page_get url, agent sleep(rand(6)+2) begin return agent.get(url).parser rescue Errno::ETIMEDOUT, Timeout::Error, Net::HTTPNot...
5 месяцев, 2 недели назад spacemonkey
63
голоса
2
ответа
У меня есть набор страниц, которые я пытаюсь очистить с помощью Mechanize в Ruby. На некоторых страницах они перенаправляются на страницу, которая хочет, чтобы я заполнил форму списка, и затем отпр...
5 месяцев, 2 недели назад GDP2
110
голосов
1
ответ
Например, я попробовал массу вещей: Механизируйте проблему с кодировкой Ruby 1.9.3 и как мне преобразовать из объекта Mechanize :: File в объект Mechanize :
5 месяцев, 2 недели назад David Hahn
76
голосов
1
ответ
Я пытаюсь загрузить файлы с сайта, использующего CDN для распространения. URL-адреса на странице загрузки заканчиваются файлом file.pdf, но при нажатии на ссылку в браузере происходит загрузка файл...
1 год, 2 месяца назад JP.
99
голосов
3
ответа
Я знаю, что в Stackoverflow есть очень похожие сообщения, но я все еще не могу понять, что не так с моей попыткой. # login to the site mech.get(base_URL) do |page| l = page.form_with(:action => ...
1 год, 2 месяца назад Zach
77
голосов
2
ответа
У меня есть скрипт, который посещает fcc.gov, затем нажимает ссылку, которая запускает загрузку: require "mechanize" docket_number = "12-268" #"96-128" url = "http://apps.fcc.gov/ecfs/comment_searc...
1 год, 3 месяца назад user94154
77
голосов
1
ответ
Нам нужно получить доступ к журналам для нашего экземпляра Stripe в течение определенного периода времени. Там нет конечной точки API (grrrr), поэтому мы пытаемся быстро очистить экран, потому что ...
1 год, 3 месяца назад Nick Erdenberger
63
голоса
2
ответа
Я бы хотел указать базовый URL-адрес, поэтому мне не нужно всегда указывать абсолютные URL-адреса. Как я могу указать базовый URL для использования Mechanize?
1 год, 3 месяца назад Andrew
63
голоса
1
ответ
Мне нужно войти в Jenkins через искателя, чтобы собрать некоторые данные, но Net/HTTPS получает неполную страницу по сравнению с источником Jenkins, вот и источники: Net/HTTPS 'HTML <!DOCTYPE ht...
1 год, 3 месяца назад Filipe Gorges Reuwsaat
77
голосов
2
ответа
Добро пожаловать, у меня возникла проблема, gem mechanize не будет подключаться к сайту. Gem установлен. Код: require 'mechanize' agent = Mechanize.new main_page = agent.get 'https://imbd.com' main...
1 год, 3 месяца назад Ioo
99
голосов
1
ответ
Я пытаюсь сделать put в сервере rails. Я получаю эту ошибку: 'send_request_with_body': undefined method 'bytesize' для # (NoMethodError) - это код ruby: agent = Mechanize.new agent.basic_auth('user...
1 год, 3 месяца назад user2994005
98
голосов
1
ответ
Я пытаюсь очистить страницу Crunchbase, но я получил эту ошибку: ryzal~/Desktop/Sites/scraper$ ruby scraper.rb /Users/Ryzal/.rbenv/versions/2.3.1/lib/ruby/2.3.0/net/http.rb:933:in 'connect_nonblock...
1 год, 3 месяца назад Rizal Yusoff
77
голосов
1
ответ
Я ищу ссылки через css form page = agent.get('http://www.print-index.ru/default.aspx?p=81&gr=198') и после этого у меня в переменной страницы много ссылок, но я не знаю, как их использовать, ка...
1 год, 3 месяца назад user2596615
88
голосов
3
ответа
Я пытаюсь отправить эти параметры в виде строки abc = authenticity_token=lXewdcVQRHZb+O9gVZ+E0xG9Mtg2rnTznkEN/wVk2a4=&design[design_code]=xyz&&design[price]=600&design[discount_perc...
1 год, 3 месяца назад chirag7jain
108
голосов
2
ответа
Я пытаюсь использовать механизатор, чтобы вытащить некоторые цены, и я до такой степени, что могу обрабатывать все, что стоит менее 1000 долларов, но как только что-то бьет выше 1000 долларов, в ре...
1 год, 3 месяца назад dstep
88
голосов
1
ответ
Я следую за предложением Jimm Stout для сайтов, которые не задают тип контента. agent = Mechanize.new do |a| a.post_connect_hooks << ->(_,_,response,_) do if response.content_type.empty? r...
1 год, 3 месяца назад zhon
77
голосов
2
ответа
У меня проблемы с сайтами, использующими http-аутентификацию, у меня есть список сайтов, на которых я немного разбираюсь, но некоторые из них имеют HTTP-аутентификацию. Я не хочу получать содержимо...
1 год, 3 месяца назад Luis D Urraca
63
голоса
1
ответ
Я пытаюсь очистить группу страниц с помощью Mechanize и JRuby. Я использую JRuby для многопоточности, поскольку на MRI программа немного медленная. Тем не менее, я столкнулся с некоторыми проблемам...
1 год, 3 месяца назад GDP2
78
голосов
1
ответ
Я пытаюсь получить механизацию, чтобы перейти через SSKS-туннель SOCKS5. По какой-то причине он продолжает получать ошибку во время HTTP-запросов. Как и получение EOF до этого. Если я отключу настр...
1 год, 3 месяца назад LF4
77
голосов
1
ответ
Я пытаюсь найти страницу для div, содержащих определенный класс, и затем нажимать на них. Каждый из этих divs, содержащих класс, имеет на них событие onclick. Мой текущий код выглядит так, home_pag...
1 год, 3 месяца назад randy newfield
98
голосов
1
ответ
Я использую следующий код: require 'rubygems' require 'mechanize' agent = Mechanize.new agent.get("https://www.rottentomatoes.com/user/account/login/") do |login_page| inside_page = login_page.form...
1 год, 3 месяца назад vivek pandey
125
голосов
3
ответа
запуск этого кода с помощью mecahnize 2.7.3 и ruby 2.3.0dev: require 'mechanize' agent = Mechanize.new agent.keep_alive = false agent.open_timeout = 2 agent.read_timeout = 2 agent.ignore_bad_chunki...
1 год, 3 месяца назад user1759796
63
голоса
1
ответ
Я пытаюсь получить изображения из Twitter, но он сбой, если я использую user_agent_alias . Мне нужно указать агент пользователя. Но почему это происходит с помощью псевдонима агента? Это нормально?...
1 год, 3 месяца назад Luccas
87
голосов
3
ответа
Используя Mechanize, мне нужно найти способ ограничить запросы до 1 в секунду (или 1 раз в 5 секунд или 2 раза в минуту и ​​т.д. точка найдет способ оценить префиксные запросы). Поиск, похоже, это ...
1 год, 3 месяца назад blueblank
-5
голосов
1
ответ
Как написать код, который будет нажимать ссылки на веб-странице с указанными условиями: Скрипт должен заглянуть в каждую строку div.table и проверить, содержит ли элемент списка (div.domains ul li)...
1 год, 3 месяца назад Aljaz
-5
голосов
2
ответа
Я собираю рубиновый механизатор и получаю с самого начала... Почему этот код: #!/usr/bin/ruby env require 'rubygems' require 'mechanize' agent = Mechanize.new page = agent.get('http://linkedin.com/...
1 год, 3 месяца назад user1222303
77
голосов
2
ответа
Я начинаю использовать Mechanize gem для Ruby, и мне интересно, есть ли в любом случае веб-сервер, который может обнаруживать и блокировать действия агента Mechanize? Если да, то какой код или шаги...
8 лет, 11 месяцев назад Chim Kan
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема