Statistics – вопросы и ответы

61
голос
1
ответ
Я пытаюсь выполнить анализ чувствительности с использованием метода Собола. Я всегда получаю ошибку, которую я не могу решить. код и результат приведены ниже. диапазоны входных переменных идентифиц...
2 месяца, 2 недели назад Omar Ali
62
голоса
2
ответа
Оказывается, что у меня есть две переменные, которые не удовлетворяют условию линейности. Зависимая переменная является непрерывной, а независимая переменная является числовой и дискретной. Здесь о...
2 месяца, 2 недели назад pyring
173
голоса
5
ответов
Для двух логических векторов x и y , длины > 1E8, что является самым быстрым способом вычисления кросс-таблиц 2x2? Я подозреваю, что ответ заключается в том, чтобы написать его на C/С++, но мне ...
2 месяца, 2 недели назад Iterator
122
голоса
2
ответа
У меня есть некоторые ранжированные данные, которые выглядят примерно так в электронной таблице Excel. 1,3 1,3 1,3 1.4 1,6 1,6 1,7 1,8 1,9 2 2 2,3 2,3 2,3 2,4 2,7 3,1 3,3 3,3 3,4 3,4 4 4,2 4.5 4,7 ...
2 месяца, 2 недели назад whathits
75
голосов
2
ответа
Я хочу прочитать следующие данные в SPSS: ID Age Sex GPA ---------------- 1 17 M 5 2 16 F 5 3 17 F 4.75 4 18 M 5 5 19 M 4.5 Моя попытка: DATA LIST / ID 1 AGE 2-3 SEX 4(A) GPA 5-8. BEGIN DATA 117M5 ...
2 месяца, 2 недели назад user 31466
62
голоса
1
ответ
Будет ли это проблемой производительности, когда я устанавливаю generate_statistics в true? Или это улучшит производительность NHibernate? Должен ли я всегда устанавливать это в true - также в прои...
2 месяца, 2 недели назад BennoDual
87
голосов
1
ответ
Я хочу сделать статистический анализ с помощью базы данных ms-sql для приложения aps.net. Каковы варианты, поскольку я не вижу много встроенных функций для моей цели? Спасибо за любые предложения. ...
2 месяца, 2 недели назад user763554
108
голосов
2
ответа
Возможно, я делаю что-то неправильно, а z-normalizing мой массив. Может кто-нибудь взглянуть на это и предложить, что происходит? В R: > data <- c(2.02, 2.33, 2.99, 6.85, 9.20, 8.80, 7.50, 6....
2 месяца, 2 недели назад Legend
97
голосов
1
ответ
Итак, нам задан набор целых чисел от 0 до n. Затем это рандомизировано. Цель состоит в том, чтобы вычислить количество ожидаемых целых чисел, которые остаются в одной и той же позиции в обоих списк...
2 месяца, 2 недели назад Son Gohan
123
голоса
1
ответ
Из Руководство FSelector : data(iris) subset <- cfs(Species~., iris) f <- as.simple.formula(subset, "Species") print(f) В частности, я имею в виду тот, что находится в "Species ~.". Теперь, э...
2 месяца, 2 недели назад Kristoff
62
голоса
2
ответа
Я хочу узнать, сколько людей за любой период времени заходят на другие веб-сайты, используя кнопки входа в социальные сети facebook, но мне не повезло найти какую-либо статистику или демографию, мо...
2 месяца, 2 недели назад Daniel-John Edward Crookes
76
голосов
1
ответ
Мне интересно узнать, как рассчитать рейтинг рейтинга из рейтингов продукта. Например, возьмите яблочный апрест. Есть два продукта A и B. Оба имеют одинаковый средний рейтинг, но 100 рецензентов им...
2 месяца, 2 недели назад morpheus
106
голосов
1
ответ
Я провел логическую регрессию по двоичной зависимой переменной и 5 независимым переменным. Данные, на которые я обратил эти переменные, - это данные опроса, спрашивающие, проголосовал ли человек за...
2 месяца, 2 недели назад Trier Von
106
голосов
2
ответа
У меня есть массив из 1000 поплавков, все между 0 и 1. Я хочу показать их на гистограмме, где выделяются самые высокие 10 значений. Проблема в том, что мои данные, как правило, распределяются, т.е....
2 месяца, 2 недели назад Seano
87
голосов
2
ответа
Я пытаюсь моделировать простое моделирование бернули, а также простое геометрическое моделирование на Matlab, и поскольку я новичок в Matlab, это кажется немного сложным. Я использовал это, чтобы л...
2 месяца, 2 недели назад S. N
173
голоса
11
ответов
Python имеет my_sample = random.sample(range(100), 10) для случайной выборки без замены от [0, 100) . Предположим, что я выбрал n такие числа, и теперь я хочу пробовать еще одно без замены (без вкл...
2 месяца, 2 недели назад necromancer
75
голосов
1
ответ
Я хочу рассчитать стандартное отклонение для каждого значения, которое приходит в систему во время выполнения. Я не уверен, как его реализовать. Я выполнил онлайн-средний def online_avg(last_avg, l...
2 месяца, 2 недели назад Bush
62
голоса
2
ответа
Извините, если это не подходящий вопрос для этого сайта, и если это необходимо, я закрою этот вопрос. Но, возможно, кто-то может дать мне идеал: Я пытаюсь найти более сложный индекс для создания ие...
2 месяца, 2 недели назад silversky
183
голоса
6
ответов
Я делаю сайт сообщества, который требует от меня подсчета сходства между любыми двумя пользователями. Каждый пользователь описывается со следующими атрибутами: возраст, тип кожи (маслянистый, сухой...
2 месяца, 2 недели назад MarySheen
75
голосов
1
ответ
Я сделал тест GOF в Matlab, но два теста Колмогорова Смирнова дали мне противоположные результаты. В Matlab я использовал этот код file=importdata('all_subj_1file.xls','\t'); [ill1]=xlsread('all_su...
2 месяца, 2 недели назад Dina
179
голосов
2
ответа
Я ищу подходящее приложение для обработки статистики посетителей для проекта Django. Любые подсказки?
2 месяца, 2 недели назад minder
87
голосов
3
ответа
Я хотел спросить, знает ли кто-нибудь обходной путь, как я могу динамически назначать аргументы для функций выборки R, т.е. я хочу написать список с разными именами, скажем, "mean" и "sd", и элемен...
2 месяца, 2 недели назад MrVengeanZe
61
голос
1
ответ
Мне нужен метод или класс, который генерирует непрерывное распределение Пуассона, способное принимать нецелое среднее значение для установки, а затем выводя кумулятивные/интегрированные вероятности...
2 месяца, 2 недели назад Ray Zhang
87
голосов
2
ответа
Отвечая на ответ @j.jerrod.taylor, позвольте мне перефразировать мой вопрос, чтобы устранить любое недоразумение. Я новичок в Data Mining, и я узнал о том, как обрабатывать шумные данные, сглаживая...
2 месяца, 2 недели назад user2771721
62
голоса
3
ответа
Я рассматриваю возможность создания собственного инструмента для отслеживания посетителей/продаж, поскольку Google Analytics и другие просто недостаточно полны в отделе данных. У них хорошие графич...
2 месяца, 2 недели назад Scott
61
голос
1
ответ
Таким образом, в настоящее время у меня есть установка типа машинного обучения с установленной системой искусственной нейронной сети. Из запроса данных, которое я получаю, когда вы спрашиваете, ука...
2 месяца, 2 недели назад SEngineerJay
-4
голоса
1
ответ
Моя оригинальная таблица: | Month | Nationality | |----------|-------------| | Oct 2015 | US | | Oct 2015 | US | | Oct 2015 | IT | | Oct 2015 | CH | | Nov 2015 | CH | | Nov 2015 | CH | | Nov 2015 |...
2 месяца, 2 недели назад Leandro Carlini Mingorance
62
голоса
1
ответ
У меня есть следующий код SAS: data vis; input v; datalines; 3169 3173 3162 3154 3139 3145 3160 3172 3175 3205 3203 3209 3208 3211 3214 3215 3209 3203 3185 3187 3192 3199 3197 3193 3190 3183 3197 3...
2 месяца, 2 недели назад Stoner
87
голосов
2
ответа
Как правило, у меня есть более техническая проблема, но я упрощу это для вас с примером подсчета мячей. Предположим, что у меня есть шары разных цветов и один индекс массива (инициализированный все...
2 месяца, 2 недели назад Erol
75
голосов
3
ответа
Я нахожусь перед решением для how to do with flagged data для пользователей. Запрещенные данные могут быть image , a wiki , a user , а что-то еще нужно управлять как a message board . Я бы хотел ра...
2 месяца, 2 недели назад vitto
63
голоса
1
ответ
Я хочу сравнить результаты двух работ, а именно, методы матричной факторизации Koren (2009) и Rendle et al (2009) Первый использует значения RMSE, а второй - AUC. Есть ли способ сравнить их? В частнос
2 месяца, 2 недели назад user3001
114
голосов
1
ответ
Я не знаю, можно ли его найти, но я использую кластер Kmeans с Mahout, и я придерживаюсь следующего. В моей реализации я создаю с двумя разными потоками следующие кластеры: CL-1 {n = 4 c = [1,75] r...
2 месяца, 2 недели назад Tha Q
62
голоса
1
ответ
Я смотрел здесь: numpy И я вижу, вы можете использовать команду np.random.standard_cauchy() задающую массив, для образца из стандартного Коши. Мне нужно пробовать из Коши, который может иметь x_0 !...
2 месяца, 2 недели назад Euler_Salter
106
голосов
1
ответ
Я новичок в R, и мне нужна ваша помощь. Я рисую концентрацию (y) и даты (x). около года. Теперь я хочу отметить несколько красных точек внутри этого сюжета. Я знаю, что делаю это с помощью функций....
2 месяца, 2 недели назад Marv
76
голосов
1
ответ
Я имею множество S = {a1, a2, a3, a4, a5,......, an}. Вероятность, с которой каждый элемент выбирается, - это {p1, p2, p3, p4, p5,..., pn} соответственно (где, конечно, p1 + p2 + p3 + p4 + p5 +.......
2 месяца, 2 недели назад Adwaitvedant
62
голоса
1
ответ
Я имитирую некоторые гамма-случайные числа plot(density(rgamma(10000,8.1,rate=0.00510)),lwd=2,las=1,cex.axis=0.75, main=expression(paste("Gamma Distribution with",' scale ',alpha," and rate ",beta)...
2 месяца, 2 недели назад user3483060
149
голосов
4
ответа
Я хотел бы построить гистограмму со средним (средним) значением на ней (пометьте ее, например, синей, жирной линией). Я пытаюсь сделать это с помощью команды plot, но даже если добавить параметр: "...
2 месяца, 2 недели назад Mateusz Kędzior
114
голосов
1
ответ
У меня есть массив Nx2, который хранит координаты x, y из N разных точек. Я должен рассчитать распространение данных (я думаю о среднеквадратичных значениях). Есть ли какие-нибудь функции в scipy, ...
2 месяца, 2 недели назад Physicist
61
голос
1
ответ
У меня есть список дат > (length(list$date)) [1] 36799 Я хочу сделать relative and absolute frequencies analysis и рассчитать эту частоту дат на временной шкале. Как я могу реализовать это в R? ...
2 месяца, 2 недели назад user2051347
-4
голоса
1
ответ
У меня есть следующие данные, представляющие функцию выживания. # A tibble: 53 x 2 month survival <int> <dbl> 1 0 1.00 2 1 1.00 3 2 1.00 4 3 1.00 5 4 1.00 6 5 1.00 7 6 0.999 8 7 0.998 9...
2 месяца, 2 недели назад jakes
Чтобы , пожалуйста,
Выберите тему жалобы:

Другая проблема