Deep-Learning – вопросы и ответы

62
голоса
1
ответ
В keras , как model.fit и model.predict имеет параметр batch_size . Мое понимание заключается в том, что размер партии в model.fit связан с пакетной оптимизацией, каков физический смысл batch_size ...
4 недели, 1 день назад user297850
61
голос
1
ответ
Я любезно новичок в глубоком обучении и своем подходе к прогнозированию временных рядов. Недавно я нашел одну статью о предсказании временных рядов с использованием повторяющихся нейронных сетей (R...
4 недели, 1 день назад Keithx
106
голосов
1
ответ
Я хочу визуализировать весовые уровни слоя нейронной сети. Я использую pytorch. import torch import torchvision.models as models from matplotlib import pyplot as plt def plot_kernels(tensor, num_co...
4 недели, 1 день назад papabiceps
75
голосов
1
ответ
Я ищу Ubuntu AMI для AWS, который Caffe установлен и работает правильно с GPU. Есть некоторые на странице Github caffe, но они, похоже, не работают . Есть ли недавно проверенный
4 недели, 1 день назад Itack
85
голосов
1
ответ
Я подготовил сеть для своих данных. Когда я запустил это: чтобы увидеть карту вероятности plt.imshow(prob[1], cmap='hot', interpolation='nearest') plt.show() И это карта вероятности Object 1 :
4 недели, 1 день назад S.EB
60
голосов
1
ответ
Я пытаюсь определить местоположение и значения локальных минимумов на карте 2D-изображения, используя тензорный поток. Поскольку это не тривиально, мне было интересно, какой надежный и эффективный ...
4 недели, 1 день назад Oliver Ebrle
84
голоса
1
ответ
Когда я запускаю обучение с tensorflow (с настраиваемым графиком, закрытым источником), он выдает предупреждение: 2018-10-03 14: 29: 24.352895: E tensorflow/core/grappler/optimizers/dependency_opti...
4 недели, 1 день назад THN
-4
голоса
1
ответ
все У меня возникают проблемы, когда я использую нормализацию партии в Caffe. Вот код, который я использовал в train_val.prototxt. layer { name: "conv1" type: "Convolution" bottom: "conv0" top: "co...
4 недели, 1 день назад Xin Zhou
74
голоса
1
ответ
Я пытаюсь использовать нижнюю часть кода для некоторых файлов. Эти файлы должны соответствовать и дифференцироваться по числу, поэтому счетчик должен изменить номер части файла. Имена файлов генери...
4 недели, 1 день назад Helen
60
голосов
2
ответа
Я изучаю DCGAN, и мне это интересно. В естественном GAN Яна Гудфеллоуда модель дискриминатора выводит одно скалярное значение, что означает вероятность. Но дискриминатор DCGAN разработан с архитект...
4 недели, 1 день назад Soomin Lee
87
голосов
1
ответ
У меня есть tensor1 с формой [1 128, 128, 100] , и у меня есть еще один tensor2 с формой [1,128,128,1] . Если я попытаюсь вычесть tensor1 - tensor2 из последнего измерения, будет ли tensor2 автомат...
4 недели, 1 день назад Jiaju Orange Yue
74
голоса
1
ответ
Я адаптировал train_val.prototxt из bvlc_reference_caffenet для реализации клона VGG-16 в Caffe и смог обучить его GTX 1050 с batch_size: 6 и base_lr: 0.0648 (~ 0.01 * sqrt(256/6) ~ 0.01 * sqrt(42)...
4 недели, 1 день назад konze
60
голосов
1
ответ
model = nn.Sequential(nn.Linear(784, 128), nn.ReLU(), nn.Linear(128, 64), nn.ReLU(), nn.Linear(64, 10)) criterion = nn.CrossEntropyLoss() images, labels = next(iter(trainloader)) images = images.vi...
4 недели, 1 день назад Saurabh Singh
119
голосов
2
ответа
Я использую API Dataset для создания входного конвейера. Я использую метод tf.data.Dataset.map() в шаблоне, подобном следующему: def mapped_fn(_): X = tf.random_uniform([3,3]) y = tf.random_uniform...
4 недели, 1 день назад e2718281
62
голоса
1
ответ
Я понимаю, что путем повторной калибровки гауссовский шум (0, I) принимается за вход, в то же время делая всю сеть дифференцируемой. Я не могу понять, как это реализовано. Как таковые, как отобража...
4 недели, 1 день назад dulla
73
голоса
1
ответ
В фрагменте: criterion = nn.CrossEntropyLoss() raw_loss = criterion(output.view(-1, ntokens), targets) размер выхода - это torch.Size([5, 5, 8967]), размер мишеней - torch.Size([25]), а ntokens - 8...
4 недели, 1 день назад Mocialov Boris
85
голосов
1
ответ
Я пытаюсь реализовать пакетную нормализацию с использованием shadoworflow и нашел этот хороший пост . Кажется, что обе функции выполняют аналогичные параметры, но кажется, что люди используют после...
4 недели, 1 день назад MoneyBall
73
голоса
1
ответ
Я хочу использовать word2vec с tfidf в наборе данных amazon reviews, но я не могу понять, как это сделать.... Я пробовал данные, содержащие 5k отзывов с положительным результатом и отрицательным сч...
4 недели, 1 день назад Wizard_stark
164
голоса
2
ответа
Я пытаюсь предсказать использование воды населением. У меня есть 1 основной вход: Объем воды и 2 вторичных входа: температура количество осадков Теоретически они имеют отношение к водоснабжению. На...
4 недели, 1 день назад Jvr
62
голоса
1
ответ
Итак, я пытаюсь изучить фиксированные векторные представления для сегментов из примерно 200 песен (~ 3-5 минут на песню) и хотел использовать для этого Autoencoder с последовательностью последовате...
4 недели, 1 день назад Mathguy
86
голосов
1
ответ
Для определенной комбинации параметров в функции deeplearning h2o я получаю разные результаты каждый раз, когда я запускаю ее. args <- list(list(hidden = c(200,200,200), loss = "CrossEntropy", h...
4 недели, 1 день назад Sujay DSa
112
голосов
2
ответа
Изображение похожее Я получаю набор изображений, и изображения выглядят так. Как я могу удалить нижнюю часть изображения с помощью python, который не содержит полезного контента? Я прочитал изображ...
4 недели, 1 день назад Hao Chen
85
голосов
1
ответ
Я знаю, что деконволюция - это в основном свертка вывода с перевернутыми фильтрами, и я реализовал ее для 2D-данных. Но я не могу обобщить его для 3D-данных. Например, рассмотрим ввод размера 3x5x5...
4 недели, 1 день назад Ayush Chaurasia
74
голоса
1
ответ
Я использую функцию сканирования anano для реализации LSTM (длинная короткая память), но я получил ошибку, например ValueError: Please provide None as outputs_info for any output that does not feed...
4 недели, 1 день назад Alex Gao
74
голоса
1
ответ
Я пытаюсь самостоятельно изучить Deep Learning, используя несколько книг, предоставленных моим университетом и этой нейронной сетью и глубоким обучением . Процесс сложный, и поскольку я не привык к...
4 недели, 1 день назад Gabriel_Koch
61
голос
1
ответ
Я пытаюсь использовать искробезопасную библиотеку ( https://github.com/databricks/spark-deep-learning ) в блокноте Jupyter. Когда я пытаюсь "импортировать sparkdl" в блокнот jupyter, я получаю сооб...
4 недели, 1 день назад Yashwanth Madaka
84
голоса
1
ответ
Я настроил пользовательский CNN с K-кратной перекрестной проверкой в кератах с внутренним тензорным потоком. Функция model.compile() вызывается перед началом обучения, но вызов функции model.fit_ge...
4 недели, 1 день назад Smeik
-4
голоса
3
ответа
Я новичок в науке о данных, и я все еще изучаю машинное обучение. Я знаю, что мы можем использовать модели Regression , Classification , Clustering , ANN , CNN , RNN и так далее в зависимости от пр...
4 недели, 1 день назад Ind
141
голос
1
ответ
Я работаю над своим проектом Deep Learning Language Detection , который представляет собой сеть с этими слоями для распознавания с 16 языков программирования:
4 недели, 1 день назад Aliostad
-7
голосов
1
ответ
Я использую h2o биномиальное предсказание и преобразовываю несколько строковых столбцов, подобных этому X2 <- as.numeric(as.factor(test$X2)) X3 <- as.numeric(as.factor(test$X3)) X4 <- as.n...
4 недели, 1 день назад santhosh p
74
голоса
1
ответ
Я пытаюсь обучить агент на ViZDoom платформе по сценарию deadly_corridor с алгоритмом A3c и TensorFlow на сервере GPU TITAN X, однако, производительность разрушилась после тренировки около 2+ дней....
4 недели, 1 день назад GoingMyWay
74
голоса
1
ответ
Я тренировал следующую модель model = Sequential() model.add(Embedding(10000, 100, input_length = 10, weights=[embedding_matrix], trainable = False)) model.add(Bidirectional(LSTM(64, return_sequenc...
4 недели, 1 день назад Hrithik Puri
85
голосов
1
ответ
Я пытаюсь обучить модель "Широкое и глубокое обучение" на своих собственных наборах данных, и эта ошибка возникает, когда я подгоняю модель к набору тренировок. ------------------------------------...
4 недели, 1 день назад Yiqun Liu
127
голосов
1
ответ
Я читал лекции Стэнфорда cs231n и пытался выполнить задания самостоятельно и делиться этими решениями как на github, так и на моем блоге. Но мне трудно понять, как смоделировать обратное распростра...
4 недели, 1 день назад Tolga OĞUZ
113
голосов
1
ответ
Очень ценю это, если кто-то может помочь мне здесь: Я пытаюсь сделать некоторые тонкости в задаче регрессии --- мои входы представляют 200X200 изображения RGB 200X200 а мой вывод/метка предсказания...
1 месяц назад shenglih
236
голосов
5
ответов
Я пытался сделать простую вещь, которая тренировала линейную модель с Stochastic Gradient Descent (SGD) с использованием факела: import numpy as np import torch from torch.autograd import Variable ...
1 месяц назад Charlie Parker
85
голосов
1
ответ
Теперь я использую anaconda 2 и python 2.7, чтобы попытаться выполнить проблему с автоматическим кодировщиком. Код в Интернете требует "import logistic_sgd". Однако, когда я писал "pip install logi...
1 месяц назад Ramsey
61
голос
1
ответ
Я установил Pylearn2, и я хочу обучать модель, используя pylearn2. Ссылка здесь: введите ссылку здесь. Но я просто запускаю Шаг 1. Создайте набор данных. Из каталога grbm_smd запустите команду $ py...
1 месяц назад Ushou Mori
62
голоса
1
ответ
спасибо за то, что посмотрел мой вопрос. Например. Конечным результатом является сумма двух матриц A и B, например: output = keras.layers.add([A, B]) Теперь я хочу создать новый параметр x для изме...
1 месяц назад lomo
106
голосов
2
ответа
Мой код написан как это. def __init__(self, X): ops.reset_default_graph() tl.layers.clear_layers_name() self.sess = tf.Session() self.input_x = tf.placeholder(tf.float32, shape=[None, 784],name="in...
1 месяц назад xxx222
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема