Machine-Learning – вопросы и ответы

102
голоса
1
ответ
За последние несколько недель я работал над проектом по обнаружению нападений с использованием кучи на приложениях. Для этого я разрабатываю двоичный классификатор, чтобы различить разницу между ни...
8 месяцев, 3 недели назад ilikeyoyo
66
голосов
1
ответ
Для механизма рекомендаций я пытаюсь преобразовать данные моего фильма в формат arff, и хотя формат arff мне понятен, я не уверен, что лучший способ - решить следующую проблему. Мой набор данных бу...
8 месяцев, 3 недели назад Teugata
136
голосов
1
ответ
Я учусь использовать xgboost , и я прочитал документацию! Однако я не понимаю, почему вывод моего скрипта выходит из 0~~2 . Во-первых, я думал, что это должно быть либо 0, либо 1, так как его binar...
8 месяцев, 3 недели назад KenobiShan
102
голоса
1
ответ
Поэтому, когда я пытаюсь запустить некоторый код с изображением строки ниже: X_train, X_test, Y_train, Y_test=train_test_split(X_features, Y_feature, test_size=0.2, random_state=42, stratify=None, ...
8 месяцев, 3 недели назад dr2509
66
голосов
1
ответ
Я очень новичок в matplotlib и работаю над простыми проектами, чтобы познакомиться с ним. Мне было интересно, как я могу построить границу решения, которая является весовым вектором формы [w1, w2],...
8 месяцев, 3 недели назад anonuser0428
-5
голосов
2
ответа
Привет, у меня есть список кортежей, как указано ниже: [(2031, 0.11078125), (2032, 0.11131274999999999), (1298, 0.11819950000000001), (2033, 0.12396399999999999), (2030, 0.13113425), (1238, 0.13305...
8 месяцев, 3 недели назад RAM SHANKER G
66
голосов
2
ответа
Я пытаюсь реализовать очень простой 1-мерный алгоритм спуска градиента. Код, который у меня есть, вообще не работает. В основном в зависимости от моего значения альфа, конечные параметры будут либо...
8 месяцев, 3 недели назад Alec
113
голосов
1
ответ
Я пытаюсь создать свой собственный тегированный корпус для набора данных демонизации, а набор данных имеет приблизительно 6250 твитов. код ниже, хотя он дает результаты для небольшого набора данных...
8 месяцев, 3 недели назад Sadhana Singh
-5
голосов
1
ответ
Существуют ли некоторые обычные мощные методы анализа данных, которые являются общими и подходят для различных данных в различных ситуациях? Например, мне нужно классифицировать новые данные. У мен...
8 месяцев, 3 недели назад Jo Ja
164
голоса
4
ответа
Я не уверен, что это можно решить, но я все равно попрошу. В моей компании мы имеем дело с массовыми лагерями для зачисления, где небольшие группы из 5-10 человек отправляются в деревню и зачисляют...
8 месяцев, 3 недели назад Raghu
65
голосов
1
ответ
Есть ли способ выполнить инкрементную классификацию любого классификатора в Spark/MLlib? Я хочу переустановить существующую модель с новым набором данных. Новый набор данных может появиться в любое...
8 месяцев, 3 недели назад babz
79
голосов
1
ответ
Я получаю модуль не вызываемый ошибка в U-Net def unet(): inputs = Input((1,512, 512)) conv1 = Conv2D(width, 3, 3, activation='relu', border_mode='same')(inputs) conv1 = BatchNormalization(axis = 1...
8 месяцев, 3 недели назад vinu
80
голосов
1
ответ
У меня есть DataFrame оценок пользователей (от 1 до 5) относительно фильмов. Чтобы получить DataFrame где первый столбец является идентификатором фильма, а остальные столбцы - рейтинги для этого фи...
8 месяцев, 3 недели назад Daniil Andreyevich Baunov
65
голосов
1
ответ
Я хочу найти 5 ближайших соседей для каждой точки синих точек (T-SNE1) из красных точек (T-SNE2). Поэтому я написал этот код, чтобы узнать, как правильно это сделать, но я не уверен, что это правил...
8 месяцев, 3 недели назад user8523104
65
голосов
1
ответ
Ссылаясь на этот пост . Мне интересно, как мы предоставляем словарь слова с пространством для модели CountVectorizer например, distributed systems или machine learning ? Вот пример:
8 месяцев, 3 недели назад titipata
92
голоса
3
ответа
Задача: заданный набор строк с категоризацией (или набор упорядоченных векторов строк) генерирует функцию категоризации для категоризации большего количества входных данных. В моем случае эти данны...
8 месяцев, 3 недели назад BCS
-5
голосов
1
ответ
У меня есть категориальная колонка с 4000 уникальными уровнями. При использовании sklearn.feature_extraction.FeatureHasher для кодирования, этот столбец Что должно быть значением n_features, чтобы ...
8 месяцев, 3 недели назад maikeffi
91
голос
4
ответа
Я работаю над проектом, целью которого является создание программы, которая автоматически дает относительно точное обнаружение области зрачка в изображениях глаз. В настоящее время я использую simp...
8 месяцев, 3 недели назад wenxi
151
голос
1
ответ
У меня проблема, и в этот момент я полностью потерял, как ее решить. Я использую Keras со слоем LSTM для создания временного ряда. Я пытаюсь использовать предыдущие 10 точек данных, чтобы предсказа...
8 месяцев, 3 недели назад Ryan Allen
79
голосов
1
ответ
Скажем, у нас есть два сигнальных пространства S1 и S2, каждый из которых содержит сотни, возможно, тысячи сигналов. S1 - все сигналы, которые посылаются или принимаются данной системой (плоскостью...
8 месяцев, 3 недели назад JonBlumfeld
130
голосов
3
ответа
Я хочу использовать часть речи (POS), возвращенную из nltk.pos_tag для классификатора sklearn, как я могу преобразовать их в вектор и использовать? например. sent = "Это пример POS" Tok = nltk.toke...
8 месяцев, 3 недели назад Suresh
91
голос
1
ответ
Я выполнил очень простую линейную регрессию с алгоритмом градиентного спуска в JavaScript, но после консультации с несколькими источниками и попыткой нескольких вещей я не могу заставить ее сходить...
8 месяцев, 3 недели назад Alpha
102
голоса
2
ответа
У меня есть файл CSV, где в столбце "Пол" некоторые поля отсутствуют. Поэтому мне нужно автозаполнить их, используя функцию fillna(), используя python. Я даю условие, что если ApplicantIncome больш...
8 месяцев, 3 недели назад Vivek
79
голосов
1
ответ
Я пытаюсь предсказать тип автомобиля (модели) на основе идентификационного номера автомобиля (VIN). Первые 10 позиций VIN что-то говорят о типе, поэтому я использую их как переменные. См. Пример пр...
8 месяцев, 3 недели назад Donald
-7
голосов
1
ответ
Их любая возможность заменить правильное слово (например, вместо эффекта, влияния) в данном входном файле, используя библиотеку быстрого текста, созданную facebook
8 месяцев, 3 недели назад srinivas
-7
голосов
1
ответ
Я получаю эту ошибку ValueError: Ожидаемый 2D-массив, вместо него получен скалярный массив: array = 6.5. Измените ваши данные, используя array.reshape(-1, 1), если ваши данные имеют одну функцию, и...
8 месяцев, 3 недели назад Muhammad Khubaib Nasir
65
голосов
1
ответ
Я только начал узнавать о ANN около недели назад без классической подготовки. Просто просматривая видеоролики и читаю блоги/белые документы, я получил это далеко. У меня вопрос о окончательном выхо...
8 месяцев, 3 недели назад clxxxii
-7
голосов
1
ответ
У меня есть массив измерений (67233,) и нужно преобразовать его в (67233,1), но не знаете, как продолжить? Может ли кто-нибудь предложить решение Python для этого?
8 месяцев, 3 недели назад abhiraj singh
-7
голосов
2
ответа
В моем недавнем проекте кто-то пытался кластеризовать многомерный набор данных с помощью sklearn.dbscan. Но я очень сомневаюсь с этим подходом. Как мы можем узнать eps и min_samples? Я имею в виду,...
8 месяцев, 3 недели назад J.R.
113
голосов
2
ответа
Я пытаюсь обучить модель doc2vec, используя обучающие данные, а затем нахожу сходство каждого документа в тестовых данных для конкретного документа в тестовых данных, используя обученную модель doc...
8 месяцев, 3 недели назад Schlez
91
голос
1
ответ
Пусть X - набор данных m × n (m: количество записей и n: количество атрибутов). Когда число атрибутов n велико и набор данных X является шумным, классификация становится более сложной и точность кл...
8 месяцев, 3 недели назад user1468089
121
голос
2
ответа
Я новичок в машинном обучении и его методах. Мне нужно предложение для создания модели. Вот описание проблемы - У меня есть набор данных клиентов, которые владеют всеми продуктами (4 продукта) конк...
8 месяцев, 3 недели назад Uno
120
голосов
1
ответ
Я пытаюсь запустить команду seqdirectory в Mahout 1.0-SNAPSHOT с Hadoop 2.2.0. При использовании команды: seqdirectory -i input -o output Трассировки стека: Error: java.lang.RuntimeException: java....
8 месяцев, 3 недели назад Aritra
-5
голосов
1
ответ
Я прочитал эту статью сегодня: каждый регресс становится лучше с добавлением большего количества функций или переменных... Но добавление дополнительных функций увеличивает сложность и снижает интер...
8 месяцев, 3 недели назад Tweety
92
голоса
1
ответ
В чем разница между оценкой предварительно подготовленной модели и тренировкой с нуля? И если я хочу добавить некоторые слои в предварительно подготовленную модель, возможно ли это? Я предполагаю, ...
8 месяцев, 3 недели назад ce1
66
голосов
1
ответ
Я разрабатываю GAN в TensorFlow. В настоящее время график обучения feed_dict = ... sess.run(discriminator_train_op, feed_dict); sess.run(generator_train_op, feed_dict); sess.run(generator_train_op,...
8 месяцев, 3 недели назад Siyuan Ren
66
голосов
2
ответа
Я установил искру на AWS Elastic Map Reduce (EMR) и запускал SVM с использованием пакетов в MLLib. Но нет вариантов выбора параметров для построения модели, например выбора ядра и стоимости ошибочн...
8 месяцев, 3 недели назад Prem
145
голосов
1
ответ
Мое намерение состоит в том, чтобы найти его класс через алгоритм классификатора Байеса . Предположим, что следующие учебные данные описывают высоты, веса и длины ног разных полов SEX HEIGHT(feet) ...
8 месяцев, 3 недели назад yahoo.com
65
голосов
3
ответа
Вот пример, где есть пошаговая процедура, чтобы система узнавала и классифицировала входные данные. Он правильно классифицирует данные для 5 доменов данных. Кроме того, он также классифицирует стоп...
8 месяцев, 3 недели назад user4910881
65
голосов
1
ответ
Я тренирую Классификатор случайных лесов с 10 оценками. Затем я сохраняю все графы дерева с graphviz в виде файлов точек и PNG. Наконец, я делаю RandomForest.predict. Исходя из результатов прогноза...
8 месяцев, 3 недели назад thestruggleisreal
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема