Добро пожаловать в свитерный тред.Анализируем планы запросов, Поясняем, какой из гигантов СУБД лучше: MySql или SqLite.Ну а теперь серьезно: Базы данных: реляционные и объектные/документные Хранилища данных и BI ETL Хадуп и бигдатаВ этои IT ИТТ тредю поясняем за специальности, в которые можно вкатиться в сфере СУБД обсуждаем скиллы, которые нужно подтягивать новичкам* составляем базу необходимых знаний на гитхабе
>>1406481Сущности называются единственным числом.Тем более, что множественное число ты все равно не умеешь образовывать.
>>1406481Ты долго ебашил спайсы чтобы додуматься хранить билеты и поезд не в таблице билетов, а в таблице пассажиров?
>>1406481>>1406541Где таблица с рейсами? Иди дорабатывай.Ну либо своруй структуру бд самолётов с sql-ex
>>1406455 (OP)> скиллы, которые нужно подтягивать новичкамsql, основы реляционных бд, python(опционально)>поясняем за специальности, в которые можно вкатиться в сфере СУБДна hh можно посмотреть(и там же знания необходимые для нюфагов)
>>1406703тошо он изначально заточен под анализ данных, а путон вкатился в эту нишу не пойми каким боком
>>1406546>>1406541Это вы еще ему не сказали, что он навернет говна, когда пилот с одного самолета на другой пересядет.
>>1406595Я тоже читаю ин-фу от наших предков. Нам всем базачём нужно составить вопросы и создать там тред.
Я еще помню тут совсем давно один уважаемый анон пояснял за дата инженера. Я нашёл немного информации про хадуп, если ты тут, дай пожалуйста ссылки на упражнения.
>>1406721тебе не нужно их анализировать тебе нужно их обрабатывать и складывать (маня ты не дата саентист! проснись!)
>>1406455 (OP)Что там по книгам/ресурсам по которым можно освоить работу с каким-нибудь постгре и научиться sql, чтобы на собеседование стыдно не было?
Аноны, есть какой-нибудь ресурс, типо sql-exe, только по процедурным расширениям? Можно на английском.
Анон, посоветуй какую нибудь годную книгу про технические аспекты RDBMS. Ну типа как реализован конкурентный доступ, как отрабатывают локи, когда открываются транзакции и как они менеджатся
>>1407603У Оракла в документации до хуя есть.Concepts, например, если я не путаю.У Постгре тоже в документацию втыкай.
Ребят, помогите, через 2 дня собес, а мне нужно знать базовые знания запросов sql, а я кроме как вставить что то из таблицы и вытащить ничего не знаю, что за эти 2 дня можно прочитать и где?
>>1407840ну джойны почитайдальше индексывозможно cte, оконные функцииопционально процедуры/функции/вью
>>1407836>базовые знания запросов sqlCREATE, REMOVE, UPDATE, DELETE (CRUD), что еще нужно для счастья?
>>1407850Для начала нужно все-таки разобраться, что означает буква RА то ты и так на умного не похож, а своими высерами окончательно всех убеждаешь в том, что ты даун
>>1408079unmake есть в толковом словареhttps://www.merriam-webster.com/dictionary/unmakeuninsert нет>>1408074нахуй пошел, тебе наверное понравится
>>1408138Бля, я думал, тут умные-остроумные собрались.А тут ебанат в словарь полез.Бля, я думал, программист понимает, что можно что-то новое создать.А тут ебанат только готовыми шаблонами из словаря готов пользоваться.Пиздец, вообще. Закрывайте на хуй программач.
>>1408382>программачКакой нахуй программач, юродивый, это же /зкИли в лучшем случае /prrrrrrrrrrrrrrrrrЖиви с этим.
>>1408387>Какой нахуй программач, юродивый, это же /зкон дома расскажет друзьям и невесте как он подстрелил двух /зк ?
Проебал перекот.Есть одна должность которая маячит в банке.Собес на следующей неделе, есть время подготовится.Написали из требование только:Ожидаемый опыт:- Знания Oracle SQL, PL/SQL- Понимание принципов разработки OLTP систем- Умение разобраться в чужом коде- Умение отлаживать код- Умение работать с документами>Знания Oracle SQL, PL/SQLПро это расскажу думаю. Спросят поди про синтаксис, основные конструкции. Индексы, партиции, план такое говно.>Понимание принципов разработки OLTP системЧто тут хотят от меня? Ну индексы не вешать чтобы вставка была быстрее, ну sql аналитику не крутить на oltp базах, что еще тут рассказать?
>>1409326Ну вот про партиции и расскажи, как бы ты транзакционную табличку партиционировал, например, чтобы база через пару лет не подохла от миллиардов записей. Олсо, можно спиздануть, что - нахуй форейн кеи, потому что они только тормозят производительность, но если ребята с таким не сталкивались, то могут и не оценить.
Аноны, помогите. Нужно к базе данных написать простенький интерфейс, чтобы через него в эту самую бд (или эти самые бд) можно было вводить записи + проводить какую нибудь сортировку, поиск и подобные простые запросы. На чем легче всего будет реализовать? Интернетик пестрит вариантами либо с php, либо с C# + MySql или Microsoft Access, но не могу пока определиться. В этих языках и софте я полный штрих, придется с нуля осваивать. Единственное, чуток в С разбираюсь и еще меньше в плюсах.
>>1410061C# + Entity Frameworkобучающих статей на MSDN должно хватить для простейшего круда. алсо EF имеет провайдеры для множества базочек, под капотом можешь хоть SQLite заюзать
Господа, попробуйте представить, что вы стали ниибатся менеджером, который выбивает деньги на проекты у бизнеса.Деньги вы получили, но при выборе средств разработки вы столкнулись с альтернативой. Продукт вы можете реализовать, используя три СУБД:1) Oracle 2) MS SQl3) PostgressЕсть ли хоть какая-нибудь статья, которая ОБЪЕКТИВНО сравнивает эти три СУБД?
>>1410278Если нет, то как бы вы аргументировали свою позицию в ту или иную сторону, бабки не проблема
>>1410278оракл - неубиваемая хуйня для миллиарда транзакций в секунду. требует, возможно, дорогих девелоперовмс - оракл на минималках. выбор хорош если нужны какие-то решения из коробки и не хочется их девелопить с нуляпостгре - опенсурс и этим все сказано
>>14102811) Oracle Дорого. Нужен как минимум один DBA. Отточенная железобетонная отказоустойчивость при верной настройке. Куча плюх и пердолек, которые позволяют эффективно управлять СУБД и данными. Есть встроенный язык PL/SQL - процедуры/функции. Есть поддержка и подробная документация. Если если пятизначные цифры в $ на лицензирования не страшны - это однозначно твой выбор. Идеально подходит банкам или крупному ритейлу для OLTP/OLAP. 2) MS SQlДорого поделить на джва, если сравнивать с Ораклом. Развертывается на шиндовс сервере. По плюхам почти как оракле. Есть встроенный язык T-SQL - процедуры/функции. Ниже по производительности и отказоустойчивости. Поддержка сообщества подробная почти как у Оркала. Механизмы репликации отсасывают у Оракла. Подходит сторонним подразделениям банков, мелкому ритейлу и крутить 1С. Прекрасно крутит OLAP. При правильных админах и разрабах можно крутить OLTP.3) PostgressЕсли будешь использовать в интерпрайзе то нормальная поддержка все равно за бабки. В последних версиях есть процедуры и функции. Спецов найти сложнее для администрирования. Поддержка сообщества слабее, чем у ребят выше. Может крутить мелкую хуету типа телефонии, сайтов, логи, мониторинг. Есть единичные мазохисты которые крутят это в серьезном Энтерпрайзе.ИМХО за 3,5 года с БД
Товарищи, выручите пожалуйста, помогите правильно запрос к БД написать.Абстрактная задача с собеса:Есть система, отвечающая за раздачу транспорта на предприятии. Известно, что пользователи на предприятии имеют доступ к приложению, с которого могут заказать транспорт. При заказе транспорта пользователи указывают число, на которое желают взять транспорт, а также предполагаемую дату возвращения транспорта в автопарк. Пользователи могут отменять заказ машины и она снова может становиться свободной.У меня проблема вот с чем, пишу клиентскую часть, и не могу понять - как правильно написать запрос к БД, чтобы результат выдачи показывал только те ID'шники машин, которые могут быть заказаны на сегодняшнее число.
>>1410396Без структуры таблиц сделать это сложно.Я так понимаю, у машины есть атрибут типа свободно/занято. Если занято, то скорее всего можно сделать джоин к тому за кем занято-на какую дату.
>>1410401table.Car // Машина{ int id; driver_id; // Кто водитель; nvarchar type; // Тип (груз, легковушка); nvarchar mark. // Марка.}table.Order // Заказы{ int id; int car_id; // Машина; int client_id; // Кто заказал; date orderDate; // Дата заказа; date returnDate. // Дата возврата в автопарк.}Связь: 1 - TO - MANY (1 Car - Many Orders), T-SQL;Я пробовал в структуру машины добавить булевое "Свободна/Занята", но не догнал как это можно с пользой использовать.В шарповском треде мне кое-где подсказали, но что-то так и не понял как с умом использовать. Суть в том, что я через запрос могу вывести те машины в диапазоне того времени, когда они заняты. А мне бы этот запрос отреверсить как-нибудь, чтобы видеть внешние диапазоны, когда машина доступна для заказа.Запрос на внутренний диапазон:SELECT [Order].car_idFROM [Order]WHERE orderDate <= @currentDate AND returnDate > @currentDate;А мне бы наоборот, выводить те машины, которые свободны, а не заняты.Небольшой примерчик:3 машины - 3 заказа;1) Машина№1 - с 01.06.2019 по 07.06.2019;2) Машина№2 - с 05.06.2019 по 10.06.2019;3) Машина№3 - с 31.05.2019 по 05.06.2019;Точкой отсчета в запросе я беру, сегодняшний день - 01.06.2019.Следовательно, по запросу мне машина №2 должна быть доступна с сегодняшнего числа по 04 (или 05, хотя в собесе не сказано, что машина может быть заказана и возвращена в тот же день).
Дароу. Короче меченый я тебя спас и в благородство играть не буду придумаешь для меня пару заданий и мы в расчете. А именно для такой базы данных надо придумать 10 запросов на INSERT и 10 на UPDATE и 1 на DELETE. Сами решения писать не надо только текст заданий. Фантазии пиздец не хватает написал уже 40 ебучих заданий из 60. схема на пикчах
Привет антуанам.Наслышан про схему, когда вместо offset'ов используются page_token'ы (потому что оффсеты медленные на больших таблицах).Как мне объясняли, page_token'ы делаются по какой-то хитрой схеме через where, но я тупой и у меня не получается нагуглить это самостоятельно.Подскажите, как вообще это делается?Я вижу это так, что когда у меня запрашивают N-ю страницу, я беру оттуда id последней строки (у меня это uuid, но по тдее не важно) и возвращаю в качестве page_token'а, соответственно на N+1 страницу мне передают этот самый токен и я делаю запрос вида "дай мне 10 строк после строки у которой id=page_token", но я хз, как это сформулировать в виде запроса.Сортировать по id'ам и говорить where id > page_token не вариант, потому что это отсортирует строки по дате создания (а у меня другие правила сортировки).Вопрос сложный, только для настоящих программистов, так что с меня утроенное количество сотен нефти.
>>1410790ORM'ом или SQL - мне лишь бы понять суть.И, если не затруднит, подскажите литературу, где подобные случаи разбирают/рассматривают.
>>1410799https://pastebin.com/WWjstCU3в общем задача звучит как Gaps and Islands. но с наскоку гуглить может быть непонятноя попробовал сгруппировать по машиносу и вывести MIN/MAX свободная дата, но так делать неправильно ибо все промежуточные занятые даты будут пропущено. я ебал делать еще одно CTE, для начала сойдет (если я вообще правильно понял суть). путем самопердолинга можно довести запрос до нужного
>>1410814Премного благодарен, подскажите пожалуйста ещё что-нибудь по подобным задачам, где можно какие-то материалы почитать, хотелось бы найти что-нибудь для обучения на реальных примерах, без абстрактных задач.
>>1410821лично я не учился на каких-то примерах. все - это либо задания с собесов, либо реальные кейсы, либо что-то случайно нагугленное
Пытаюсь подключить учебную базу из MySQL в VS 2017.На ютабе решается установкой других версий коннектов.Но у меня проблема не решается, двач помоги.
Пацаны, в мускул workbench можно как-то передвигать нормально эти линии, показывающее отношения? А то у меня они наложились на друг-друга, под таблицы, под небо, Аллаха. Хочу штоб покрасивше их расставить, но не пойму как очевидным способом нихуя не дает
>>1406455 (OP)Можно ли за пару месяцев нахвататься, чтобы взяли на самую простенькую вакансию релейтед?
Привет, анонимусы. Есть такой кусок БД, а смысл таков: есть айтемы, у айтемов может быть сколько угодно параметров и соответствующих им значений. Например, свитер: цвет - зеленый, размер - маленький, автор - Дэвид Блэйн. Теперь вот думаю, либо я дурак и не могу запрос составить чтобы по параметрам и значениям выбрать айтемы, либо я дурак и неправильную архитектуру запилил. Что скажете, уважаемые?
>>1412077разделять parameter и value тебе нужно ибо значения параметров имеют фиксированный сет значений?если бы проще, то как на пикеа вообще и из твоего поделия можно сочинить более-менее вменяемый запрос, правда за охуительное количество джоинов оптимизатор тебе спасибо не скажет
>>1412084>значения параметров имеют фиксированный сет значений?Да. С точки зрения оптимизации было бы заебись параметры в столбцы выносить, как раньше и было, но я устал каждый раз код править добавляя новый параметр, поэтому решил сделать их динамическое создание через админку. И встрял.
>>1412088поколоночное хранение подобных данных - это либо сознательная денормализация ради убийственного перфоманса, либо топкекрофлтак что не получается?
>>1412089select t.id as item_id, p.id as parameter_id, v.id as value_idfrom item ujoin item_value iv on i.id = iv.item_idjoin value v on v.id = iv.value_idjoin parameter p on p.id = v.parameter_idwhere p.id = 1and v.id = 3and p.id = 3and v.id = 5Такой запрос работать не будет. Нужно выбрать одновременно несколько параметров и несколько значений.
>>1412093Хочу выбрать айтемы, у которых: параметр "цвет" = значение "зеленый", параметр "размер" = значение "маленький" и т.д. Количество параметров в запросе может быть разным, но я это в коде сделать смогу.
>>1412094чет я сам не подрасчитал сложноту задачиhttps://pastebin.com/wDAvZuj5не думаю, что такое решение имеет право на существование, но, справедливости ради, оно работает как ты хочешь лол)я юзаю SQL Server-ный диалект, полагаю, все подобное поддерживается всеми стандартными базамив T/SQL мне не хватает шарповского "выбрать строки, у которых встречаются все значения из подможества".еще как вариант делать каскадную фильтрацию, типа:- выбрать все айтемы-- отфильтровать, у которых "цвет" не "розовый/зеленый"--- отфильтровать, у которых "размер" не "маленький"но подобное на SQL реализовывать занятие так себе. разве что генерить запрос в коде и на верочку отправлять его в базу
>>1412136Мощно. Буду пробовать, спасибо тебе.Если я правильно понял у меня получается модель EAV, которая часто во всяких интернет-магазинах встречается.
Пасаны, покажите пожалуйста конкретный (не просто х->у......, а с какой-нибудь табличкой или конкретными данными) пример нетривиальной и полностью нетривиальной функциональных зависимостей.Я прост не понимаю как разница у них будет выглядеть
Антоны, я переношу огромные массивы данных с FireBird на Oracle. Но деля это через промежуточный .csv получается пиздец, кодировки летят как угорелые. Что делать то?
Нужно сохранить древовидную структуру в БД, при этом нужно:1. Быстро выбирать все поддерево для указанной ноды.2. Быстро перемещать поддерево к другому родителю.То что нагуглил: с первым хорошо справляется nested sets, со вторым adjacency list. Materialized paths - вообще непонятно зачем нужное говно.Накидайте идей как хранить в БД древовидную структуру, так чтобы усидеть на двух рекваиментах? Может скомбинировать как, или materialized paths спасут меня?
>>1413473Какая база-то?Оракл умеет нормально выбирать деревья/поддеревьяПостгре, вроде, тоже.parent_id -> idХули сложного?Не, конечно, если у тебя МуСКЛ, то просто иди на хуй.А если ты еще не решил, какая у тебя база, то бывают, внезапно ГРАФОВЫЕ БДТипа https://neo4j.com/
>>1412136>но подобное на SQL реализовывать занятие так себе. разве что генерить запрос в коде >генерить запрос в коде Внезапно, это единственно правильное решение
>>1413507внезапно, это решение упирается в реализацию и соскочить с написанного будет непросто в реальном мирке
Как оптимальнее всего написать накопительный запрос по зарплате сотрудников.Create table PersonA(Tbn number primary key, name varchar2(20), otd number, sal number); --Табельный номер , имя, отдел , зарплатаInsert into PersonA(Tbn,name,otd,sal) values(1, 'Аня',10,9000);Insert into PersonA(Tbn,name,otd,sal) values(2, 'Саша',10,5500);Insert into PersonA(Tbn,name,otd,sal) values(3, 'Таня',10,7000);Insert into PersonA(Tbn,name,otd,sal) values(4, 'Ваня',20,2300);Insert into PersonA(Tbn,name,otd,sal) values(5, 'Олег',20,4300);Insert into PersonA(Tbn,name,otd,sal) values(6, 'Коля',20,3900);Insert into PersonA(Tbn,name,otd,sal) values(7, 'Таня',30,7000);Insert into PersonA(Tbn,name,otd,sal) values(8, 'Макс',30,9000);Insert into PersonA(Tbn,name,otd,sal) values(9, 'Таня',30,8500);Insert into PersonA(Tbn,name,otd,sal) values(10,'Макс',30,9900);Insert into PersonA(Tbn,name,otd,sal) values(11,'Олег',30,9900);Insert into PersonA(Tbn,name,otd,sal) values(12,'Макс',30,9900);Insert into PersonA(Tbn,name,otd,sal) values(13,'Макс',30,9900);Insert into PersonA(Tbn,name,otd,sal) values(14,'Макс',30,9900);Insert into PersonA(Tbn,name,otd,sal) values(15,'Макс',30,9900);Insert into PersonA(Tbn,name,otd,sal) values(16,'Макс',30,7000);Insert into PersonA(Tbn,name,otd,sal) values(17,'Таня',30,3500);commit;Вот например тут если мы сделаем запрос:select name , otd , sal , sum(sal) over (partition by otd order by sal) as num from personA, то результат будет некорректный, из-за того что поле sal может повторятся. Как написать корректную аналитическую функцию?
Результат выполнения выделенный функции будет как на пике, мне же нужно, чтобы суммирование продолжалось.
Я ничего кроме этого придумать не смог.select a., sum(sal) over (partition by name order by name, num) from (select a., row_number() over (partition by name order by name) num from PersonA a) a
И правильно ли я понимаю, что в конструкции "sum(sal) over (partition by name order by name, num)" первым выполняется оператор сортировки?
Господа, пожалуйста, подскажите. Имеется БД как на первом пике: три таблицы с данными foo, bar, baz и одна таблица common, в которой ведется учет добавления в те три таблицы. Например, если в таблицу foo добавится элемент:insert into foo values (0, 999);то в таблицу common автоматически добавится такая новая запись:insert into common values (N, 0, null, null);, где N - автоинкрементирующийся id.Вопрос такой, можно ли и как сделать такой селект по таблице common, чтобы в результате получить данные со всех трех таблиц foo, bar, baz (пока предположим, что все поля у таблиц одинаковые)? Кароче, нужен результат как в таблице select result, как показано в примере на втором пике.Я пытался через inner join сделать, записав три join подряд, но естественно результат нулевой, потому что он для всех условий join использует конъюнкцию, то есть находит пересечение множеств. Мне надо чтобы он в строке common находил не null поле с id и дергал данные из соответствующей таблицы по этому id.
>>1413880>Вопрос такой, можно ли и как сделать такой селект по таблице common, чтобы в результате получить данные со всех трех таблиц foo, Можно
>>1413504Про Оракловый connect by prior я знаю, и кстати MySQL с 8 версии тоже может выбирать поддеревья целиком. У меня больше вопрос перфоманса. Как там работает connect by prior не совсем ясно, но скорее всего просто тупо джоинит внутри. Быстрее чем самому, запрос за запросом выбирать. Но с nested sets когда тупо выбирается диапазон и рядом не стоит.Neo4j я знаю и начал смотреть, но там пока вообще непонятно насколько быстро выбирается поддерево.
>>1413914В оракле все нормально.Там точно не джойны внутри.Делаешь запрос и смотрешь план. Думаешь.Нео - говно, но если тебе нужен граф немыслимой вложенности, то почему бы и нет?
>>1413787Объясни пожалуйста:>UNBOUNDED PRECEEDING - Окно начинается с первой строки текущей группы и заканчивается текущей обрабатываемой строкой- CURRENT ROW - Окно начинается (и заканчивается) текущей строкойКак это можно связать через between? Почему UNBOUNDED PRECEEDING не включает в себя CURRENT ROW? И почему на результат аналитических функций влияет дублирующие строки в имени функции?
>>1414153>Окно начинается с первой строки текущей группы и заканчиваетсягде ты это описание нашел? где нашел, там и оставьграницы окна указываются как rows between <start> and <end>. причем, заставить учесть одну и ту же строку дважды без костыльных подзапросов достаточно проблематично
>>1414344Том КайтСУБД ОраклАлсо, запрос корректно работает и без >BETWEEN AND CURRENT ROW Просто там по умолчанию стоит RANGE UNBOUNDED PRECEEDIN
>>1414619Бля, второй раз в жизни на дваче что-то полезное!Никогда не пользовался этими функциями и даже не знал, что так можно, епта!Даже в сраном мускуле это есть, охуеть, что уж там про оракл говорить...Спасибо, аноны!
>>1414689Томас Коннолли, Каролин Бегг — Базы данных. Проектирование, реализация и сопровождение. Теория и практика.
Приветик. Хочу переименовать название одной колонки в таблице, погуглил (так как я нуфаг), выдало решение:ALTER TABLE table_name RENAME COLUMN name1 TO name2;Но чот меня шлет нахер читать документацию и ругается на синтаксис в месте: COLUMN name1 TO name2;Пробовал с кавычками, писал RENAME_COLUMN (а что а вдруг) результат тот же.Подскажите, как переименовать, будьте добры.Использую PhpMyAdmin, если это важно.
>>1415009я чувствовал, конечно, что его книгу по основам реляционной теории я купил зря. но это настолько бесполезный автор что ли в домене?
>>1415052Ну, примерно как Матфей в области рассказов об Иисусе.Апологет Невзорова, конечно, назовет его клоуном.Все ты правильно сделал.His book An Introduction to Database Systems, currently in its 8th edition, has sold well over 700,000 copies not counting translations, and is used by several hundred colleges and universities worldwide.Хуйня, конечно. У Пупкина лучше все описано.
>>1415326круто, рофловасян смог скопипастить с вики. а сказать-то что хотел?я говорил где-то, что у него хуево написано (что-то где-то)?
Здоров, котоны. Реализовал я, значит, кусок базы в шаблоне EAV.Поиск по атрибутам и значениям выполняю вот так:SELECT t0.FROM eav t0join eav t1 on t0.phone_id=t1.phone_id and t1.parameter = "Источник" and t1.value = "Сайт 1"join eav t2 on t0.phone_id=t2.phone_id and t2.parameter = "Группа" and t2.value = "Основная"join eav t3 on t0.phone_id=t3.phone_id and t3.parameter = "Регион" and t3.value = "Ленинградская область"group by t0.phone_idhaving count() = 3Проблема в том, что в EAV-таблице приходится держать сами значения и они многократно дублируются. Хотелось бы в этой таблице держать только ID, а искать так же по значениям. Если добавить таблицы с атрибутами и значениями, а в этом запросе их заджойнить, то поиск не возвращает ничего. Пример с джойнами:SELECT t0.FROM eav t0join parameter p on p.id = t0.parameter_idjoin value v on v.id = t0.value_idjoin eav t1 on t0.phone_id=t1.phone_id and p.name = "Источник" and v.name = "Сайт 1"join eav t2 on t0.phone_id=t2.phone_id and p.name = "Группа" and v.name = "Основаная"join eav t3 on t0.phone_id=t3.phone_id and p.name = "Регион" and v.name = "Ленинградская область"group by t0.phone_idhaving count() = 3Я что-то не так делаю или это в принципе невозможно?
>>1415805>Крис Дейт спиздил, чтобы продавать по 250 баксов.ух сволочь>Вон, у анона уже жопа полыхает Еще тлеетСмотрю и не могу найти что то стоящее Объясни мне момент. С учетом фундаментальной основе в виде знания БД, почему в целом так мало людей разибирающихся в них чуть больше "сделать ручками зазубренные вызовы", хотя и таких не так много, ибо ОРМ... Аналитиков БД в обще кот наплакалпытался найти себе ментора
>>1415977Но большая часть из них это не программисты на питоне и яваскрипте.Да даже и на яве, хули там.ОРМ, которая может за тебя "сгенерить" схему БД, и, тем более, ебаные РЕСТ-репозитории, которые вообще без всякой мысли программиста что-то хуярят в базу, или из нее читают...Да ну на хуй.Просто сайт-визитку сделать это заебись, быстро, и всем видно. Молодец, мальчик, фуллстэк, 300кк/нсА огранизовать правильное, надежное хранение с разумной скоростью характерных выборок - да кто ж это увидит? Ничего же не пердит и не свистит.Вот и специалистов не видно в толпах говнокодеров.Только и всего
>>1415979>специалистов не видно в толпах говнокодеровво-первых, попробуй заглянуть дальше своего "проекта"во-вторых, говнокодерство может быть обусловлено положняком на самом проекте (sad but true)в-третьих, уметь использовать ОРМ тоже нужно. и, обычно, без знания того, какой код нагенерит тебе этот ОРМ, сильно не погуляешьсякто для тебя специалист-то вообще?
>>1416004Да я не про свои проекты же.В моих проектах у меня есть я, мне других не надо.Я про то, что вижу вокруг.Даже если не брать двач, бггг, то форумы и ебаные тенденции (напоминаю про способность ОРМов генерить схему базы, такое кто мог придумать, на такое кто мог подписаться, и почему это еще живо, мм?)ОРМ - хорошо. Там, где ему место.Но, опять же, ОРМ по большей части делают люди, которые пляшут от программирования и объектов. А не от грамотной схемы.Поэтому некоторые очевидные (для меня) ходы через какой-нибудь Хибернейт охуеешь делать.
Помогите мне, я студент-постгрессодебил. НУЖНА ПОМОЩЬ!Я пытаюсь создать функцию и триггер, который будет обновлять атрибут timeorder с текущей датой, когда атрибут floatingItem обновляется. Функция, с которой я работаю, работает с одной проблемой. Он обновляет все записи, а не те, которые были обновлены. Проблема: при обновлении данных в floatingItem timeorder остается неизменнымALTER TABLE public.orders ADD COLUMN timeorder timestamp without time zone;CREATE FUNCTION web() RETURNS trigger AS$$ BEGIN IF new.floatingItem = FALSE THEN UPDATE public.orders SET timeorder = current_timestamp WHEREnew.bubNum=orders.bibNum;END IF; RETURN new;END;$$LANGUAGE plpgsql VOLATILE; CREATE TRIGGER IF NOT EXISTS mytrigger AFTER UPDATE ON public.fund FOR EACH ROW EXECUTE PROCEDURE mytrigger ();
>>1416023>CREATE FUNCTION web() RETURNS trigger ASНа хуя?В чем проблема код написать сразу в триггере?
>>1416069Не, я уже глянул в доку, это ебанутый синтаксис постгреты бы показал свой апдейт, который заставляет обновиться все записи
>>1416023и ты уверен, что new должно сработать, а не NEW?я постгре не ебал особо, не знаю, насколько он регистрозависимый
>>1416023>UPDATE public.orders SET timeorder = current_timestamp WHEREnew.bubNum=orders.bibNum;>UPDATE public.orders>orders.bibNumЯ бы либо orders. выкинул бы, либо public добавил бы
нихуя не работает бляяяCREATE FUNCTION web() RETURNS trigger AS$$ BEGIN IF new.floatingItem = FALSE THEN UPDATE public.orders SET timeorder = current_timestamp WHEREnew.bubNum=orders.bibNum;END IF; RETURN new;END;$$LANGUAGE plpgsql VOLATILE; CREATE TRIGGER web AFTER UPDATE ON public.fund FOR EACH ROW EXECUTE PROCEDURE web ();
>>1416011>ОРМ по большей части делают люди, которые пляшут от программирования и объектов. А не от грамотной схемыя, честно говоря, не вижу противоречия в использовании ОО-модели и грамотной схемы базочки
>>1416162Грамотная схема базочки не должна ничего знать про ОО-модель.Только и всего.Потому что схема реляционной бд строится по своим законам, а ОО-модель - по своим.Я, в общем-то, об этом.
>>1416324так модели уровня ORM - это рефлексия модели базы данных, с которой (обычно) приложение (бизнес-логика) не работает напрямуюесли я нихуя не понял и сказанул хуйню, просто проигнорь
>>1416386Ок. Чтобы понятнее было:сделай со звездочкой, но убери груп байвнимательно смотри, что у тебя в выборке получаетсяи почему не группируется вообще
>>1417418Ещё как держат. Оракл это не только бд, но и целый стек накрученный поверх этой бд, и в банках этот стек используют во всю.
>>14174321. Простота. Все операции перед глазами, а не хуй знает где по стеку вызовов. Меньше шансов нафакапить с распределёнными транзакциями.2. Скорость. Ты знаешь какие будут запросы в момент разработки, и можешь тюнить сразу же. Можешь пересобрать статистику вручную при необходимости, добавить хинтов, прибить план запроса гвоздями или не делать нихуя ибо так быстрее.3. Единая платформа и куча программистов в штате под неё. В платформе есть всё что душа пожелает, даже готовая АБС за отдельный прайс4. Легаси. Nuff said.
>>1417432Т.е. ты не видишь разницы в цепочке:достать хуй из базы - сделать из него объект - ебануть что-нибудь с этим объектом - отправить обратно в базуисделать все это в базе, выдав наружу только какой-нибудь иммутабл срез данных?
>>1416442Братан, второй запрос вообще ни одной строки не выводит. Группировать нечего. Я потому и спрашиваю что я не так делаю, раз у меня по ID ничего не ищет.
>>1417827У меня только вот так получилось это сделать, но выглядит как-то стрёмно.SELECT t0.phoneIdFROM eav t0join eav t1 on t0.phoneId=t1.phoneId and t1.parameterId = (select id from parameter where name = "Источник") and t1.valueId = (select id from value where name = "Сайт 1")join eav t2 on t0.phoneId=t2.phoneId and t2.parameterId = (select id from parameter where name = "Группа") and t2.valueId = (select id from value where name = "Основная")
Анон реквестинг хелп.Надумал тут сдавать экзамены на сертификацию по мелкософт SQL, первый экзамен 761 сдал без особых проблем, готовлюсь к 762, так там оф учебник говорит, что его нихуя не достаточно и оно так. Особые проблемы ощущаю с dmv и мониторами для чека ресурсов и тюнинга производительности(Activity Monitor, Data Collector Sets, sys.dm_sranaya_ebota и т.д.). Знает ли анон какие проверенные ресурсы по данной тематике и/или прикладные конкретно для 762. В инете полно дампов, но там ответы неправильные, и их явно недостаточно, ибо цель не тупо натаскаться на экзамен, а подтянуть себя заодно.
Аноны, обьясните пожалуйста нубу, что происходит при выполнении запроса, например, с сортировкой? Как ведут себя таблицы с которых идет выборка данны? Например, запрос Slect * From Student ORDER BY name DESC; По какому алгоритму этот запрос обрабатывается? Сначала таблица Student сортируется по name, а уже потом возвращается? А после того как таблица вернулась операции отменяются? Или создается буферная таблица, с которой сначала выбираются данные, а уже там сортируются?
>>1417967Согласно оф мануалу от MS SQL(другие, полагаю, работаю так же):the logical query processing order, which is the conceptual interpretation order, is different. It starts with the FROM clause. Here is the logical query processingorder of the six main query clauses:1. FROM2. WHERE3. GROUP BY4. HAVING5. SELECT6. ORDER BYEach phase operates on one or more tables as inputs and returns a virtual table as output.The output table of one phase is considered the input to the next phase. This is in accord withoperations on relations that yield a relation. Note that if an ORDER BY is specifed, the resultisn’t relational. This means that you can’t operate on such result with an outer query becausean outer query expects a relation as inputКарач, Order by работает на основе того, что сделали другие операторы, поэтому, кстати, только в нем можно обращаться к столбцам результата по алиасу.
>>1418040>Нужно смотреть план запроса.Если покажешь такой план, где ОРДЕР БАЙ не последним идет, я охуею.Но ты же не покажешь, да?
>>1418045Да пожалуйста - запрос с фильтрацией на больше/меньше по rownum и сортировкой.Запрос с аналитической функцией - тоже отработает после сортировки.Охуеть, да?
>>1418111Я так и думал, что найдется мастер-ломастер, который покажет на ордер-бай из вложенного селекта.Найс.Давай следующую попытку. С ордербаем от общего селекта.Передавай привет, кстати, тому мудрецу, который вхуячил ордербай в подселект, он же там так нужен!
>>1418136Первое - разумно, да. Хотя это и, очевидно, краевой случай.Про аналитические функции поразмышляю. Но не вижу такой хуйни, кроме как для тех, которым важен порядок строк.Но, очевидно, план запроса и тут на хуй не сдался. И так понятно, что если ты оперируешь rownum, то он будет после любых других действий.
Объясните мне, почему вы такие никчемные? Пока вы рисуете схемки, тянка из МФТИ стала 59тым контрибьютором PostgreSQL.https://postgrespro.ru/blog/company/4203947Что вычувствуете, когда узнаёте о таких вещах?
>>1418529Ну, роунам - специфичные случаи, но иногда бывает. Например, когда ты в подзапросе сортируешь по дате и добавляешь rownum as rn в поля выборки, а потом по нему делаешь rn = 1 - получаешь первую запись по дате. Таки лучше случая date = (select min date from huy).Насчёт аналитики - влияет на план запроса, если в аналитике важна сортировка(а она чаще всего важна, насколько я сталкивался в пределах своей работы). От сортировки зависит, будет ли аналитическая функция заново сортировать набор или будет использовать уже имеющийся отсортированный.А ещё сортировка может повлиять на выбор оптимизатором хэш джойна или мердж джойна при соединении двух наборов данных, так-то.
про порядок обработки. Вот вам дока: https://docs.microsoft.com/en-us/sql/t-sql/queries/select-transact-sql?view=sql-server-2017Logical Processing Order of the SELECT statementThe following steps show the logical processing order, or binding order, for a SELECT statement. This order determines when the objects defined in one step are made available to the clauses in subsequent steps. For example, if the query processor can bind to (access) the tables or views defined in the FROM clause, these objects and their columns are made available to all subsequent steps. Conversely, because the SELECT clause is step 8, any column aliases or derived columns defined in that clause cannot be referenced by preceding clauses. However, they can be referenced by subsequent clauses such as the ORDER BY clause. The actual physical execution of the statement is determined by the query processor and the order may vary from this list. FROM ON JOIN WHERE GROUP BY WITH CUBE or WITH ROLLUP HAVING SELECT DISTINCT ORDER BY TOP
>>1418692Ты по-английски плохо читаешь, да?>This order determines when the objects defined in one step are made available to the clauses in subsequent stepsИ все.К предмету обсуждения не относится вообще.К предмету обсуждения относится вот это:>The actual physical execution of the statement is determined by the query processor and the order may vary from this list.Попробуй в следующий раз читать все буквы
>>1418622>А ещё сортировка может повлиять на выбор оптимизатором хэш джойна или мердж джойна при соединении двух наборов данныхДай ссылку почитать про этоБез подъебки прошу
>>1419119Ну, вот что-то похожее на правду:https://studfiles.net/preview/1037891/page:30/А так там даже читать не о чем: если у тебя два отсортированных набора данных, то для группы значений из первого набора идёт поиск таких же значений во втором наборе до нахождения первого большего - дальше нет смысла искать, набор-то отсортирован.Как nested loops, но меньше итераций вложенного цикла за счёт предварительной сортировки либо чтения индекса.
>>1419151Ну, твоя же ссылка говорит, что хешу вообще не всралась сортировка.В сортмердже не будет итераций вообще, а будет 1 проход по одному набору, и 1 по другому.НО! Сортировка ни на что не влияет. Оптимизатор может без всякой сортировки с твоей стороны решить, что сотрмердж будет быстрее.В общем, сделай селект с /*+ USE_MERGE (или как в твоем диалекте хинт выглядит), и ордер баем. Хоть по тем же полям, что были в условии объединения.И глянь в план запроса. Где будет ордер бай?Если ты говорил о том, что имеет смысл херачить ордер бай в подселекты, то нет, не имеет. Если ты хочешь, чтобы сработал сорт-мердж, так оптимизатору и скажи. А не прыгай с бубном.
>>1419597Правильно моя ссылка говорит. И я тебе говорю, что сортировка нужна для мердж-джойна, а не для хэш джойна.Только вот оптимизатор может на основании наличия в запросе сортировки и объема выборки сам выбрать мердж-джойн, а может выбрать хэш-джойн.А может и выбрать мердж-джойн и сам отсортировать наборы данных. А один точно будет сортировать.Смотри пикрил и не неси хуйню, что сортировка подзапроса не имеет смысла в случае мердж-джойна.А ещё ты, наверное, не очень понимаешь смысл и процесс построения реального плана запроса и хинтов.
>>1419694Пиздец, я так и думал (судя по тому, что первую ссылку ты прислал на русском), что с английским у тебя беда.Удачи.
>>1420021Хера ты рофлишь.Ну давай, укажи, где я неправильно перевел. Я признаю свою ошибку, если ты не ебучий тролль без мозгов.
Ну ка двощерские погроммисты, поясните начинающему Богу Access-а как спланировать базу данных. Есть два стула... Один нормальный, второй с отверстием. Триллиард остальных характеристик абсолютно одинаковые. И есть таблица в которой эта пара стульев идет по возрастающему размеру, типа: стул высотой 19см, стул высотой 21см. Так вот, заводить по паре записей, типа стул 19см, стул 19см с отв. или сделать доптаблицу: "с отверстием";"без отверстия" и ключ этой таблицы добавить в таблицу со стульями? Но тогда опять их будет по две записи. Короче я уже нихуя не понимаю
>>1420520А теперь выключи смехуечки и объясни, что у тебя за схема, в которой нельзя дырку в стуле сделать характеристикой. Высоту, значит, можно, а тип сиденья нет?Если это два разных объекта, то как не пытайся, придется делать две записи.
>>1420666>то как не пытайсяПнятненько. Думал есть секретные многоходовки от мастеров проектирования БД.
Существуют ли какие-нибудь преимущества у noSQL перед обычными реляционками?Тут есть люди, которые работют с хадуп и террадатой? Если ли у терродаты преимущества перед, например, ораклом? Правильно ли я понимаю, что она гораздо сильнее распаралленина?
>>1420937Непересекающиеся задачи, а не преимуществаКогда кто-то пытается использовать noSQL для того, для чего все остальные десятилетиями используют SQL, это просто значит, что этот кто-то - мудак
>>1420937Обычно упоминается CAP теорема. noSQL это быстро но не гарантируется целостность данных в каждый конкретный момент времени. SQL (с транзакциями) - медленно но гарантируется целостность данных.
>>1420969там, где у тебя естественным образом возникает 3НФ и, соответственно, постоянное пересечение таблиц - там sqlтам, где неструктурированная информация (до хуя текстов, про которые тебе настрать, кто они, откуда, зачем, когда и где родились, и как связаны друг с другом) - там nosqlно умнее будет, если ты в гугле забьешь nosql vs sql и прочтешь первый пяток из выдачи
Анон, сколько средняя ЗП разработчика БД в ДС?Пишу пока изредка процедуры и триггеры на работе, сам бэкенд-разраб.Вот думаю перекатиться, тк всегда хотел лучше разбираться в БД и проектировании, нравится писать на SQL, да и вообще ищу более консервативную область IT без модных фреймворков, гик-культуры, маскотов и прочей блевоты. Потом может в аналитику перекачусь.
>>1421482Хм, а сколько у тебя лет опыта и на каком языке пишешь? Может просто останешься в нём же, но найдёшь более интересную работу? Стартовую ЗП сеньора ораклиста я бы обозначил в 150+, но это устаревший на сегодняшний день подход - сейчас в БД принято только хранить данные.
>>1421482мне как бекенду [как правило] нужно разбираться в базочках чуть выше среднего уровня. офк, если сильно распределенные команды, то там за этим могут следить совсем отдельные люди, но, преимущественно, на твоей стороне все, чего касается бэк, входит в зону ответственности (хотя бы на уровне, я знаю слово redis и почему мы достаем сейчас трогаем его, а не мускульный кластер)
Привет. Подскажите как вкатиться в базы данных (какой-нибудь учебник или что-то типа того). Сам по базам данных слушал только курс в универе и писал чё-то на C# с entity framework, но уже всё забыл.
Привет, анон.Не увидел в шапке гайда, но спасибо на том, что такой тред вообще есть. Хотел бы получить совет куда дальше расти.Имею за плечами 6 лет опыта oracle developer. Уровень оценил бы как крепкий мидл, но многих нюансов работы базы не знаю, какие должен знать сеньор.Последние два года работаю в одном из топ банков, в основном пишу бизнес-логику, работа уже становится однообразной.Понимаю, что писать однообразный код и решать типовые задачи придется вскоре через силу. В какую сторону развиваться дальше? Вкатываться в ентерпрайз разработку желания особого тоже нет (имеется в виду java). Может в дата инженеры или сайнтисты? Вообщем вопрос, куда можно податься разрабу БД, при этом чтобы переквалифицироваться частично и/или постепенно. А если по ЗП не сильно просесть - то вообще сказка.
Ананасы, работа интересует? Есть вакансия для начинающих вкатывальщиков с минимальным опытом работы, или вообще без него.Нужен эскуэльщик, который быстро разберется в существующих скриптах, и будет хуярить новые как безумная обезьянка. Быстро и правильно. А также - смотреть на цифры, которые выгрузились, и проверять их на адекватность. Эти скрипты нужно документировать и цеплять к экселю. Больших познаний в sql не нужно, нужно понимание как работают оконные функции, джойны и как выбрать индекс для таблицы. ЗП от 100к, в зависимости от опыта. В общем, особо уметь нихуя не надо, но работы много.Ах да, из формальных требований нужна вышка, остальное не принципиально.Если кому-то интересно, телега @random_1234, пишите, пообщаемся.
>>1422779Вот ты и разрешишь спор выше насчёт за sort merge, раз шесть лет опыта.Так ты же можешь с таким количеством опыта начать свои темы продвигать. Начиная от какого-нибудь сборщика патчей заканчивая оптимизацией бд в целом.Ну, то есть, ты же можешь расти внутри своего банка, разве нет?
>>1422839>Вот ты и разрешишь спор выше насчёт за sort merge, раз шесть лет опыта.Ну начнем соправданий того, что все учатся по-разному и на разных примерах и учебниках и 6 лет работы ни о чем не говорит.Ниже расскажу про фейл, который случился не так давно.Думаю order все же в первую очередь используется, когда клиенту требуется предоставить результат запроса в сортированном виде (top n, pagination и т.п.). В примере из поста с вопросом очевидно, что сортировка выполнится последней.В любом случае согласен с аноном, который предлагает смотреть реальный план соединения двух сортированных выборок, с хинтом и без. >А может и выбрать мердж-джойн и сам отсортировать наборы данныхЗадался вопросом, а может оптимизатор отказаться от промежуточных сортировок, которые явно указаны в коде запроса? Например, в случае merge joina двух сортированых выборок, результат будет отсортирован по ключу соединения , а в случае hash joina нет такой гарантии?Кстати, за все время пару раз встречал код, где явно прописаны были хинты. Думаю, если статистика обновляется регулярно, то оптимизатор очень редко мажет с планом.А попытки поиграться с хинтами заканчивались максимум чуть худшим планом выполнения. Так же встречал вот такое применение order bySELECT * FROM demoorder by case when id%2=0 then '1' else '0' end descтолько вместо case использовался decodeс последующей фильтрацией rownum = 1.Посмотрю план, кстати, не понятно чем это эффективнее простого фильтра в where.
>>1422888Ну, значит, мой проеб, я неправильно сделал выводы на основании того, что читал.Насчёт промежуточных сортировок - кстати, даже не задумывался. Хрен уже с этим sort merge, насчёт этого - думаю, что если сортировка одна, он вынесет ее на верхний уровень. А вот в случае нескольких - уже не знаю.В любом случае, я сталкивался с тем, что реальный план может отличаться от того, который строится без выполнения запроса. Это и насчёт явных хинтов: сам был ситуации, когда мердж в подзапрос выглядел с виду хорошо, а на самом деле выбрал NL для набора данных в несколько миллионов с обеих сторон, если не ошибаюсь. И пока я явно ему не сказал use_hash, он не выполнялся. То есть либо смотреть v$sql_plan, либо лог сервера, мирончик показывал как(а я уже не помню, как именно).Можно ещё про driving_site сказать, но это немного другое дело.А иногда тот же use_hash может быть лучше при хуевом факторе кластеризации и table access by rowid.Про твою сортировку - мб там функциональный индекс был? Хотя этот запрос же выбирает, по факту, рандомную строку среди чётных - мало ли, зачем нужно было именно так.С другой стороны, оракл говорит, что нет гарантии, что один запрос в два разных момента времени вернет одинаковые с точки зрения сортировки наборы данных, так что, в теории, и обычный фильтр должен дать случайную строку хотя я не раз обращал внимание, что хотя бы для простых запросов без параллелей порядок один и тот же. Либо как в индексе лежит, либо "сортирует" по rowid.ты забыл про фейл рассказать
>>1422913>ты забыл про фейл рассказатьЭто все относится к Ораклу, в других СУБД может и не воспроизвести.1. В процедуре, в самом внутреннем вложенном цикле в курсоре написал селект с большим количеством джоинов по таблице из которой удаляются/добавляются записи в той же самой транзакции. Если не вдаваться в подробности, то на большом объеме входных данных это вылилось в подвисание процедуры.Основная причина - чтение данных не из блоков, а из сегмента отката. Ну это со слов более опытных коллег такая причина.В логах сессии это проявлялось очень большим значением buffer_gets, что считается дурным знаком.2. Представим таблицу, в которой есть текстовая колонка "Значение свойства" (val ) - для хранения значений с разными типами данных: строки, числа, даты ."Код свойства" (code) - все значения с одинаковым кодом относятся к одному типу данных."id объекта" (object_id) - несколько разных свойств могу относиться к одному объектуУпрощенно, задача была написать запрос, выбирающий объекты с конкретным значением свойства. Заранее известно, что требуемому коду свойства соответствуют числовые значения.Таблица свойств PТаблица Object Oselect o.*from o, pwhere o.id = p.object_idand p.code = 'PRICE'and p.val = :x, где x - число.колонки p.code, p.val - индексированы простым индексомТак вот на одном стенде этот код работал без ошибок, а на другом завершался с ошибкой рано или поздно. Ответ очевиден, но если вдруг кому-то интересно подумать, могу под спойлер ответ спрятать.Надо помнить, что в оракле, если в коде запроса есть бинды, но нет явного приведения типов в сравнении переменной и значения колонки, то тип колонки таблицы приводится к типу переменной.В одном случае план запроса был с index range scan по колонке code, т.е. сначала находилась запись, где точно было число, а потом происходило сравнение.В другом же был full scan и для каждой записи происходила попытка преобразовать значение к числу, что и вываливалось в ошибку, если в строке встречался не числовой символ.Мелочь вроде, но досадная, нельзя такое упускать.2.
>>1424706Жиза, сталкивался и с тем, и с другим. Второй пункт - так вообще в первые пару месяцев постоянно допускал такие ошибки - первичные ключи у нас были текстовые, а сравнение могло быть с числом, а оракл всегда при сравнении строки с числом неявно приводит первую к числу. Но нюанс про биндовые переменные не знал, запомню.А первый пункт - да, есть такое, хотел как-то апдейтить 40+ миллионов одним мерджем, откат операции лет больше 25-ти минут.
>>1424706>Основная причина - чтение данных не из блоков, а из сегмента отката.Если блок был обновлён апдейтом, то оригинальный блок помещается в сегмент отката. Оттуда будут читать данные другие сессии, если им понадобится тот же самый блок, и производиться rollback. Но твоей собственной сесии, которая обновляет данные, обращаться в сегмент отката не за чем.Ты упомянул про циклы, да еще и вложенные. Всякие forall не зря ведь придумали, sql в циклах работает медленно. По поводу buffer gets. Вангую, что после того как блок был прочитан в кэш, затем обновлён, Оракл не мог получить его из кэша и перезачитывал заново с диска. Отсюда серьёзно возросший I/O, который и повесил процедуру. Но это предположение.> тип колонки таблицы приводится к типу переменной.Не совсем так, приводится к старшему типу. Если у тебя поле нумбер, а переменная варчар2, то конвертироваться будет бинд, и всё будет хорошо. А если наоборот, то да, конвертироваться будет поле, и индекс не будет использован.
>>1424974Да, верно, неправильный вывод сделал.Вот этим утверждением руководствовалсяDuring SELECT FROM operations, Oracle converts the data from the column to thetype of the target variableВидимо под target variable подразумевается переменная для хранения результата запроса.
Анончик, помоги плз. Собираюсь делать свою приложуху. С беком мало работал, с базами еще меньше. С основами скл разобрался(как запросы делать), теперь нужно спроектировать базу, но я не знаю как. Подскажи статей(не книги), можно на английском, как по-быстрому спроектировать базу ньюфагу.
>>1425760>По-быстрому>Спроектировать базу>НьюфагуКек.В первую очередь - кури нормальные формы. Потом пойми, какая бд тебе нужна - транзакционная или аналитическая. Дальше сам догадаешься.
Двач,добрый день,не могу понять как можно реализовать определенную задачу,в общем,в Excel есть таблица с номерами телефонов,номером группы и именем. Всё это нужно конвертировать в Word подставляя к шаблону. Т.е. ,может так будет понятнее.Excelтелефон Группа Имя123 1 Лера222 2 Женя444 3 КатяWord Студент группы 1 Лера была зачислена(или отчислена). Контактный номер 123Можете помочь или я могу пойти нахуй?
>>1425998почему ты с этой задачей пришел в тредик про базочки?не уверен, что офисные продукты могут вот так влегкую импортировать данные из одного пакета в другой, да и по образцу тем более
>>1425998Тебе один раз или какая-то интеграция нужна?Если один раз, выполни свой select, потом скопируй результат просто ctrl+v а потом вставь в word и excellЕсли умеешь вставлять не только через ctrl+v, все получится.
Выручайте, поцоны. На работке сменилось руководство, мне дали задание вкатиться в область, в которой я вообще нулевой. расклад такой: БД оракл, есть програмизды, которые пишут обновы. Мне нужно эти обновы накатывать, перед этим делая бекап тех элементов, которые затрагиваются обновлением. Как в это въехать по быстрому, что почитать? Может кто ссылку на статью/главу даст. В данный момент нужен именно этот минимум знаний, более подробно изучать буду уже потом.
>>1428371О, Дима, привет)).Если я угадал, то у тебя весь функционал уже есть.А если нет - то пиши сборщик, который по имени файла из патча будет звать процедуру, которая текст пакета вытаскивает из бд и делай spool в файл бекапа.это если из sqlPlus будешь ставить патчи.
>>1428397"Райдер, опять тыНет, это не я!"Бтв раз не ты, то окей.Короче, простая схема: вот есть у тебя патч (архив, ветка в гите или ещё какое изъебство). Ты пишешь прогу, которая формирует из файлов патча скрипт для sqlPlus(т.е файл, в котором у тебя будут вызовы выполнения файлов патча) в определенном порядке(например, DDL до DML), а в этой проге проверяешь, что если тебе встретился пакет/функция или что-то в этом роде, то ты перед выполнением файла из патча включаешь спул, достаешь текст этого объекта(он попадет в указанный в спуле файл) и выключаешь спул.Вот тебе простой бэкап. Если ты особо извращенец - повесь триггер на DDL, чтобы текст старого объекта записывался в таблицу бэкапа + была запись в таблице логов.
Привет, ребятки. Есть кто по сфинксу?Можете пояснить как в sphinxql заставить работать select distinct так же как в mysql?Версия 2.2.11
Анонасы!Тупой вопрос из разряда "читай документацию", но все же, может, кто-то от доброты душевной ответит.Таблица с записями с группировкой по полю Х.a varchar,b numberx number(например: x - ид сотрудника, b - месяц, a - оценка работы)Как взять такие записи по max(b) group by x, у которых В МАКСИМАЛЬНОЙ ПО b записи a like '%zaebal%'?(т.е. взять только таких сотрудников, которые в последний месяц заебали всех)Как это сделать без подселектов.С подселектом любой дурак сделает.Having я же не могу подвязать, он только по агрегатным условиям работает.Короче, можете издеваться сколько влезет, только ответьте, как сделать одним селектом (может оконные/аналитические функции?)
>>1435460>это значит в последний месяц для каждого работника иль чо?да, там же написано дальше:>т.е. взять только таких сотрудников, которые в последний месяц заебали всех)
>>1435991Ну, даже не знаю, что тебе на это и ответить.Давай, чтобы не было лишних споров, я переформулирую:слово SELECT во всем запросе должно быть только одноБолее того, во From должна быть только одна таблица только один разЯ подозреваю, что это так не сделать. Но я дремучий папуас среди специалистов, вся надежда на это.
>>1436110Честно, не знаю, как тебе именно помочь с таким условием, но попробуй поиграться с cube и rollup, вдруг там отыщешь нужное тебе. А если это oracle, то можешь изъебнуться с model.Проблема в том, что вышеупомянутые расширения группировки, скорее всего, в плане запроса будут использовать union all и разные группировки в каждом из запросов - та же работа rollup, если мне не изменяет память, так и описывается. То есть, строго говоря, одним селектом это не будет.
>>1435414СУБД какое?С помощью АНСИ с одним селектом сделать это довольно сложно, но я вижу вариант сделать это в оракл.
>>1436819Давай ораклЯ оттуда подумаю, в чем цимесПрям ща Постргес, так что почти ораклНо я надеялся, что я просто проебал новшества в анси (я оконные функции, например, только пару месяцев назад по диагонали проглядел, хотя ебашу много лет).С другой стороны, это ж значит, что я все правильно понимаю. Хотя задача настолько очевидная, что странно, почему к ней еще не прикрутили простое решение
Анончики, может кто оценить лабораторную? Что поменять, чтобы потом не охуеть, когда нужно будет пилить из этого курсач с приложением? Есть требование к числу сущностей, а с фантазией и представлением работы поликлиники трудно, так что как уж вышло.
Первый раз использую базу данных в приложении.Мне нужно, чтобы пользователь выбирал какое-то большое количество параметров (у каждого параметра выбор да/нет). Параметров около 1000. Как лучше это хранить и реализовать? Я подумал, что нужно делать такую таблицу ИмяПользователя - 0011100... где 1 или 0 выбор параметра.А отдельно хранить список параметров с соответсвующими индексами.Может есть лучше решение?
>>1437393Обращение-Прием 1:1 - супер-спорно ) Причем анализы едут от обращения, а диагноз от приемаЗанимаемая должность - Должность как минимум сбивает с толку. К тому же ставка привязана к кабинету по факту, а не к реальной должностину и График. предполагается, что у тебя люди приходят только в нужные дни с Х до У? смену сочинить бы е-маёи анализы можно сделать посложнее, если тебя напрягают делать много сущностей. ибо на практике очень мало таковых, где одно значение на выходе и норма тоже одной цифрой описывается )>>1437415[Пользователи] 1:М [Парамерты пользователей] М:1 [Параметры]
>>1437422>Обращение-Прием 1:1 - супер-спорно )Да, с этим соглашусь, ошибочка, пациент вполне может записаться к нескольким врачам.>Причем анализы едут от обращения, а диагноз от приемаА это непонятно. Ну, как бы, пациент обращается и идет либо к врачу (прием), либо на анализы (они же необязательно врачом на приеме назначаются). Диагнозы ставятся врачом на приеме. Пока не доходит, на какую ошибку ты указываешьНад остальным покумекаю.>>1437449Если обрамить квадратными скобками - вроде как да.
>>1437459я не совсем понял, что ты хотел описать как "Обращение", а что как "Прием". с одной стороны там все можно залить в одну сущность, с другой есть нюансы.ну вообще обращение оно не всегда линейное. я вот пришел к терапевту потому, что голова болит (считай, обращение началось еще до приема), терапевт посмотрел (прием раз), отправил к хирургу (прием 2.1) и патологоанатому (прием 2.2) (а это все то же обращение, но не точечное во времени, очевидно), они еще куда-то отправили, плюс накидали анализов. причем, кто-то посередине не может поставить никаких диагнозов пока не пришли ответы из направлений.
>>1437422>[Пользователи] 1:М [Парамерты пользователей] М:1 [Параметры]Но ведь тогда вторая таблица получится сверх большая. Каждый новый пользователь будет увеличивать её на 1000 строк (это если параметров только 1000). Если количество пользователей будет большим, пиздец же случится, не?
>>1437499пару лямов строк любая хоть сколько-нибудь серьезная СУБД отработает без больших проблем. тебе же не SELECT * FROM делать, предполагается, что ты еще и использовать будешь адекватно таблицу.разделение параметров по колонкам (в одном физическом аттрибуте или по каждому на один параметр) сверх-сильно усложняет поддержку такого решения.если ты сможешь сгруппировать параметры каким-либо образом и выделить нечто вроде:[Пользователи] 1:М [Параметры пользователей 1] М:1 [Параметры_1][Пользователи] 1:М [Параметры пользователей 2] М:1 [Параметры_2][Пользователи] 1:М [Параметры пользователей 3] М:1 [Параметры_3]будет попроще, но это такое себе решение, я бы ниадобрил
>>1435414Есть вариант сделать в ансиselect x, max(b)from table_prgroup by xHaving max(b) = max(case when a = 'zaebal' then b else null end);Но, в таком случае b - не всегда будет текущим месяцем, а максимальным для каждого сотрудника, если я правильно понял, это то, что тебе нужно
>>1435414Я и забыл совсем и про model тебе что-то говорю.Это же max keep, ёпта. А в ордер бай пихаешь кейс, в котором a like '%zaebal%' даёшь единичку, а остальному - null. И тогда у тебя выберется максимум для именно таких значений a.
У меня в задании курсовой образуется замкнутыц цикл в отношениях сущностей (нужно создать бд по заданным таблицам т.е. добавлять своё нормас, а убирать что-то - не круто). Так вот с этим циклом сижу мучаюсь уже сколько всего перечитал так толком и не въехал, кажется, будто препод троллирует. Суть - составить расписание занятий, выглядит примерно так. С телефонп накалякалДолго бьюсь над тем как все организовать, подкиньте почитать про то что цикличность это круто и тд или хотя бы пару идей как организовать. Мозговой шторм иссяк на идеях сделать последнюю таблицу неким расширением второй, но тогда это будет уже один ко одному, а по заданию один ко многим отношения везде
>>1438057а ты уверен, что он образуется?я вот вижу какую-то каракулю в пэинте и честное слово, что все именно так
>>1438189Ты ничего не добьёшься, имея только корочку.По моему субъективному мнение тебе подобных из высшего заведения нужно выкидывать, поэтому я тебе принципиально не буду помогать.
>>1438193Задание может и нормальное составить расписание вуза и сделать запросы на свободные аудитории и т.д., но как раз его и надо подстроить под схему, которая и кажется ебанутой
>>1438180пиздец лолну ладно, а вопрос в чем? цикличные связи - это в общем не то, чтобы плохо, это странно по меньшей мере. но в твоем случае это норм потому, что задания другого нет. только цимес в том, чтобы Table2->Table4 или Table3->Table2 были по факту 1:[0..1/M]. иначе ты ни строчки не вставишь в базочку возможно, в транзакции так можно изъебнуться, но я сомневаюсь
>>1438200На твой взгляд со стороны тебе не кажется схема ебанутой? Сколько бы не рыл интернеты и русские и ангельские везде в основном проблемы вида "у меня цикл в бд и т.п., как это исправить?" Если же это нормальное явление, сразу же съебу
>>1438206Да, все вопрос был в том является ли цикличность чем-то нормальным вообще. Спасибо, анон, буду изощряться
>>1438201Это долбаёбов, которые просирают сроки сдачи курсачей и не в состоянии самостоятельно лог. схему спроектировать.
>>1438215Вопрос был не в проектировании а в явлении цикличности в отношениях между таблицами в бд. Нормальная ли тема это где можно по этому поводу инфы нарыть
>>1438209Мне кажется ебанутой сама идея задания подстраивать что-либо под какие-либо схемы, а не строить самому, про схему я вообще ничего не говорил.
>>1438211как бы если тебе придется хранить граф в базе данных, то цикличность станет привычным вопросом. фишка в том, что для графов есть свои хранилища, зачастую, более эффективные, чем реляционка.на практике такое можно встретить в иерархических данных, типа, организационная структура компании или что-то вроде этого.
>>1438216>Нормальная ли темаНет, но иногда она вполне имеет место быть. Например, в бух. учете, связь между дебетом и кредитом вполне может быть цикличной.
Поясните за ";" и "/" что, когда используется? Почему например в pl/sql developer скрипт может пройти без ошибки, а в sql navigator поругается на слэш или точку с запятой?
>>1438645; - конец блока, / - конец команды.Скорее всего, прошло от того, что sql*plus должен как-то понимать, какой enter - это перевод строки, а какой - сигнал на выполнение, вот и / воспринимается как символ конца потока.Всегда используй ;. Но если у тебя pl/sql блок - то заканчивай его /, чтобы следующий выполнился.
Есть таблица (table), структура/данные следующие:А - 100А - 200А - nullB - 100B - 300Как сделать запрос, который выдаст макс по первому столбцу, если там нет значений null, иначе выдаст null.
>>1439062Забиваешь этот вопрос в гугл и выбираешь в выдаче ответы, подходящие к твоей субдcase используй
>>1439069Что мне в гугле ввести, лол? Я минут 40 эту ерись писать пытался.Пока в голову пришло только ето: with a as(select t1, max(t2) m_t2from tablegroup by t1)select distinct a.t1, case when table.t2 is null then table.t2else max(t2)from a, tableНо это не правильно, т.к. результат будет =>A-200A-nullB-300 Как это фиксить?
>>1439083>Что мне в гугле ввести, лол? https://www.google.com/search?q=sql+null+as+max&oq=sql+null+as+max&aqs=chrome..69i57.5903j0j7&sourceid=chrome&ie=UTF-8Если ты не способен даже на это, то я бы, на твоем месте, поискал другое хобби
Я джавист, хочу изучить что-нибудь фундаментальное, просто чтобы лучше понимать, что происходит внутри. Например, Serializable в InnoDB pessimistic lock с блокировкой выборки на апдейт, а в Postgres - optimistic с ошибкой при коммите. Хз, что за это отвечает, как это вообще гуглитьДля такого Дейт подойдёт?
>>1439061Select t1,Case when Max(case when t2 is null then 1 else 0 end) = 1 then null else max(t2)endFrom tableGroup by t1
Что не так с этим запросом?Задание:Для каждого производителя, у которого присутствуют модели хотя бы в одной из таблиц PC, Laptop или Printer,определить максимальную цену на его продукцию.Вывод: имя производителя, если среди цен на продукцию данного производителя присутствует NULL, то выводить для этого производителя NULL,иначе максимальную цену.
>>1406455 (OP)Часто в вакансиях сисадмина/линукс-инженера можно увидеть требования:Апач/нгинкс, постфикс/довекот, бинд,Субднейм/субднейм/субднейм. На счёт последнего можете подсказать что учить надо?Субднейм.орг/документейшн от корки до корки? Может знаете какой смысл они вкладывают это? Какая-то конкретика. (А то может они вкладывают в это поставить lamp, чтобы CMS встала за 5 минут)
>>1440325Субд надо на случай внесения оптимизаций. Ну чтобы запросы вместо 1с выполнялись за 0.0001 пикосекунды. Репликации, бэкапы, апгрейд бд. Выполнять в ручную какие-нибудь запросы, перезагружать демон бд на худой конец.
Я правильно понимаю, БД - такой способ хранения информации на диске, если у Вас concurrency-головного-мозга?
>>1439551Отвечая на такие вопросы, ты поощряешь долбоебов все больше и больше лезть сюда.Скоро будут приходить с вопросами, как жопу вытиратьМне это не нравится, вот и агрессивный.
>>1440325Уметь поставить, забекапить, сконфигурить, реплицировать (хуй знает, надо или нет), засекьюрить.Выдать юзерам (от дба до разработчика хуйни на жумле) доступ, чтобы они не ныли "аааа, у меня программа не видит БД"Если кто-то от тебя будет ожидать умения писать селекты и их же потом оптимизировать, можно смело слать в жопу.
>>1440562Нет.Никто не мешает тебе иметь БД в памяти.Теперь попробуй еще каки-нибудь искрометно пошутить.
>>1440708>пошутитьВ мыслях не было. Пытаюсь прояснить.>Никто не мешает тебе иметь БД в памяти.Вопрос не о "можназделоть", а о цели.
Ай нид хелп. Ищу ПО, желательно свободное для создания библиотеки документов, с возможностью редактирования этих документов и сетевым доступом.Имеется следующая задача:Есть ряд однотипных документов, порядка 500-600, в виде таблиц. Отличаются только содержимым этих таблиц. Нужно эти документы каталогизировать и иметь возможность осуществлять поиск по номеру этого документа. Находим в каталоге нужный документ, и в этом же ПО редактируем эту таблицу. Никаких картинок, тупо текст. Доступ к редактированию документа по логину и паролю. Всякие навороченые гиганты типа Битрикса не нужны. Надо, что то маленькое и функциональное.Есть что предложить?
помогите понять то что записано в регулярном выражении, запрос меняет в произвольной строке два и более встречающихся пробелов на одинwith t as ( select ' a b c ' str from dual )select str , regexp_replace(str,'( +$)|((^| ) +)','\3') as r from t'( +$)|((^| ) +)' здесь указаны все варианты пробелов в строке((^| ) +) - (если в начало строки или пробел) пробел входит больше одного раза) ? '\3' - что это? из определения не особо понять\n n представляет собой число от 1 до 9. Соответствует n-му подвыражению находящемуся в ( ) перед \n.
>>1441128https://regex101.com/Сходи туда, чтобы не быть баттхертом.Там каждый чих поясняется.Но в целом это означает "все пробелы в начале или (читай "а заодно и") пробелы в конце строки".\3 означает третье вхождение из всех найденныхкороче, хули ты такой тупой, что не можешь выполнить запрос и посмотреть, что получается?
>>1441289Я в курсе что это третье вхождение из всех найденных. И запрос тыкал КАКОГО ХУЯ ТРЕТЬЕ ТО ИМЕННО Вот в чем вопрос
>>1441128А почему не regexp_replace(str, '\s{2,}', ' ')?Это не третье вхождение, это третья подгруппа выражения, в данном случае - пробел.Вот он и меняет все, что подходит под паттерн(сиречь два и более пробелов) на один
Анон, привет, помогай-выручай.Есть задача: логировать изменения отдельных атрибутов сущностей с которыми работает пользователь. С точки зрения пользователя выглядит так: открывается форма с атрибутами сущности, редактируются сущности, пользователь жмет "ОК" и, в случае изменения значений некоторых реквизитов, должна появляться еще одна форма, на которой пользователь выбирает причину изменений.Если от выбора отказывается, то изменения не сохраняются.Причем БД? При том, что архитектура двухзвенная и при нажатии на "ОК" данные сохраняются в БД.Тут вроде бы по классике можно создать триггер, но это решит проблему логирования изменений, но логирование и обновление экземпляра сущности должно происходит только после указания пользователем причины.Как подойти к решению этой задачи?
>>1406455 (OP)Стоит в SQL Server вкатываться сейчас? На работе предлагают перейти и обучить. Чет в /б/ говорят, что эта вся хуйня уже устарела и со временем сойдёт на нет. мимо-джун-фронтэнд
>>1442478>Причем БД? При том, что архитектура двухзвенная и при нажатии на "ОК" данные сохраняются в БД.Сделай, чтобы было не так.Хули ты как маленький?Триггеры и сложные схемы коммитов - решение неудачное. Потому что потом хуй найдешь, что у тебя в какой момент срабатывает, и почему.Вообще хуярить в базу надо только после того, как у тебя ВСЯ информация уже есть.Иначе у тебя будет транзакция неизвестной длины, и все такое.Не будь мудаком, короче, сделай нормально сразу.
>>1442563Имеется в виду, что нужно либо написать так, либо поправить (если есть), чтобы коммит был не сразу после инсерта/апдейта, а после поверки на корректность.
>>1442746СУБД помогает это структурировать.Давай рассказывай как ты без субд будешь копаться в условном ляме текстовиков каждый из которых хранит по 5-10 условных строчек инфы.
>>1442762>как ты без субд будешь копаться в условном ляме текстовиков каждый из которых хранит по 5-10 условных строчек инфы100500 способов. inb4 все они и есть СУБД, заведомо. Всё хорошее назовём СУБД. Остальное - не СУБД. Ага.
>>1441763я так и написал в итоге ( и изначально). Просто почему-то именно это решение все хвалили на sql.ru...З.Ы тут есть разрабы бд или близкие к ним, шарящие в sql и немного и в[ b]pl/sql[/b]? А то я тут тестовое сделал (не сложное), отправил, должны были сегодня ответить до конца дня как сказала эйчарка, но нихуя не ответили. Хочу в общем чтобы кто-нибудь из бывалых посмотрел мое решение, неужели там все так плохо @heheloh - можно сюда писать ну или в тред
>>1443049Там я только забыл trim, чтобы удалить пробелы в начале и конце строки.Там такое решение, я думаю, чтобы именно регуляркой убрать все, как бы показать свои умения. Но зачем так усложнять - не знаю.Присылай, я разраб на pl/sql, глянем, чего у тебя там.А если не звонят, то позвони сам, хули - это нормально.
>>1442767Приведи три способа из 100500 хотя бы, как можно в многопользовательском приложении/сайте работать с данными на чтение/изменение/удаление/добавление, не используя субд,а то пока что складывается ощущение, что ты обычный тралл.
>>1443660>в многопользовательском приложении/сайтеВсё же concurrency-головного-мозга? А если нет concurrency, то и в СУБД смысла нет? Я, ведь, это и предполагал.
>>1406455 (OP)Есть ли задачники с ответами по разработке СУБД?1) Например, разработать примитивную ER модель и в конце расписывается верное рассуждение и диаграмма. Как такое гуглить?2) Есть ли годный материал по моделированию данных/мат моделированию на русском?
Помогите дебилуНужно получить все детали заказа, заменив названия столбцов на их порядковый номерЯ разобрался как переименовывать столбцы (пикрил)А как вывести с нумерацией но в таблицу изменения не вносить?
>>1445783Еееебать.Погугли алиасы. Я крайне сомневаюсь, что тебе необходимо было вносить любые изменения в таблицу.
Пытаюсь перенести базу данных с локалки на mongo atlasСоздал dump, пытаюсь передать его через команду mongorestoremongorestore --host pricingtoolcluster-shard-0/pricingtoolcluster-shard-00-00-u2jv8.mongodb.net:27017,pricingtoolcluster-shard-00-01-u2jv8.mongodb.net:27017,pricingtoolcluster-shard-00-02-u2jv8.mongodb.net:27017 --ssl --username admin --password <PASSWORD> --authenticationDatabase admin пишет Failed: error connecting to db server: no reachable serversКто-нибудь сталкивался?У меня похожая проблема с npm. Могу скачивать пакеты только через прокси (tor bundle)
>>1446103Ахахахахаха>реляционки не нужны!>sql - говно>поцаны, я не осилил, как свою модную базу перенестиОжидаемо.
>>1406455 (OP)Друзья, почему шапка не ньюби-френдли?Вкатываюсь в погроммизды (c# web), пока учебники полистываю и задачки порешиваю, хотелось бы получить основательную базу по БД, а тут нихуя нет=(( Посоветуйте годноты, чтобы сразу получить фундаментальные знания и навыки: от простого к сложному. (P.S: заумные толстенные учебники на ангельском приветствуются)
>>1406455 (OP)Что обычно подразумевается под пунктами "продвинутое знание sql" и "proficient in sql" в вакансиях дата саентиста/инжинёра?
>>1448547Знания аналитических функций, думаю, будет достаточно для дата сайнтиста.Если их знаешь, то все остальное, связанное с селектами, тоже наверняка знаешь.
>>1448381Сергей Тарасов. СУБД для программиста. Хороша для ознакомления с предметом, список литературы в конце неплох.
>>1444698Такого нет. Можешь проектировать базу на любую предметную область и сюда ERD на проверку кидать. В чем проблема? Я помогу
>>1450911https://oracle-base.com/articles/misc/analytic-functionsВсе разобрано с примерами на Оракле.
Пасаны, если у меня запрос содержит фрагмент типа "where object.id in (select object.id from object where ...)", то нужно ли мне во вложенном запросе писать ORDER BY id? Я не очень шарю в выборке типа IN, поэтому мне непонятно, вырастет ли производительность при сортировке, или наоборот упадёт из-за ненужной сортировки.
Уважаемые знатоки, подскажите пожалуйста:Есть список сотрудников и список оборудования. Нужно построить модель БД, так чтобы по каждому сотруднику можно было посмотреть какое оборудование находится у него на балансе в текущий момент, и какое было раньше. Когда он его получал, и когда сдал назад.Сперва я думал что получится что-то типа пикрил, но теперь сомневаюсь. Ведь тогда получится что один сотрудник не может брать одно оборудование два раза. Типа взял, попользовался, сдал. Потом взял еще раз. Или я ошибаюсь?Мудрые аноны, подскажите как правильно сделать?
>>1452239Либо добавь в первичный ключ дату получения девайса, либо сделай таблицу с актуальным состоянием(сотрудник-девайс-когда получил) и с историей(сотрудник-девайс-когда получил-когда отдал) и после регистрации возврата переноси строчку из актуальной в историческую.Первый вариант - то же самое, что и историческая таблица во втором, но после того как твоя бд и история разрастется до лютых размеров, очень долго будешь искать текущее состояние.
>>1452259Спасибо огромное! Насчет первого варианта понял, а вот насчет второго не очень если честно.Если тебе не трудно, не мог бы ты нарисовать как это выглядит в плане связей и ключей? Я просто первый раз сталкиваюсь с БД где больше двух таблиц с типичными связями и мой мозг никак не хочет это воспринимать.
>>1452259Правила буравчика: всегда использовать суррогатные ПК.Сегодня тебе кажется, что в качестве ПК можно использовать атрибут данных, завтра окажется, что он подвержен изменению или не уникален.В крайних двух таблицах ты так и сделал.А в средней - нет.Не еби мозги, сделай в ней суррогатный ПКПравила оформляй индексами и триггерами (ща наверняка еще подскажут, чем)
Есть табличкаid(PK), c1, c2(NN), c3(NN)мне нужно найти дубли, совпадающие по c1 и c2, но отличающиеся по с3 и, естественно, id.запрос я написал, но, мне кажется, пздц неоптимизированныйSELECT FROM mytable t1 WHERE (SELECT COUNT() FROM mytable t2 WHERE t1.id != t2.id AND (t1.c1 = t2.c1 OR (t1.c1 IS NULL AND t2.c1 IS NULL)) AND t1.c2 = t2.c2 AND t1.c3 != t2.c3) > 0;может кто нибудь посоветовать, как это оптимизировать?если я разделю этот запрос на штук 30, в каждом сделаю WHERE c2 = some_const, и объединю их UNION ALL, это будет лучше для бд на проде? или я так просто еще больше загружу бд?доверь джуну скл писать...
>>1453441Да епту.Select t1.звиздаFrom table t1Where (t1.c1, t1.c2) in(Select t2.c1, t2.c2From table t2Group by t2.c1, t2.c2Having count(звизда) > 1);
Господа, а вы в курсе, что вся та инфа что мы сюда постим имеет не совсем конфиденциальный характер. Я почти уверен, что если Абу сильно попросят он отдаст все что угодно. О ваших постах на двача может может знать ваш будущий hr, держу в курсе.
>>1453471>О ваших постах на двача может может знать ваш будущий hrДа она, блядь, кончит фонтаном от моих постов.Скорей бы.
>>1453441select id, c1, c2, c3from ( select a., count(case when first_c3 <> c3 then 1 end) over (partition by c1, c2 order by c3 rows between unbounded preceding and unbounded following) as diff_c3 from ( select mytable., first_value(c3) over (partition by c1, c2 order by c3) as first_c3 from mytable ) as a) as bwhere diff_c3 > 0
Почаны, в шапке нихуя нет, на ваших http://sql-ex.ru и http://www.sql-tutorial.ru сразу начинают с синтаксиса, а где все это тестить (если не брать консоль на сайтах), установка и настройка ms sql и прочие базовые вещи для вкатывальщиков где взять?
>>1453679В гугле забанен?Чтобы тестить на, например, ms sql, тебе потребуется - ms sql server developer edition- sql server management studio
Крч, устроился джуном на проект в бигдату.Мой стек - python (написание ETL), mpp СУБД и один из ETL-фреймворков. Мне кажется, что проекты могут завершится, а бигдата как направление нужно лишь очень крупным компаниям, и у меня гораздо больше шансов полететь на улицу чем у рандомного фронтендера. Насколько мои предположения правильны, и стоит ли вообще пытаться строить карьеру инженера данных?
Ребят, кто шарит в nosql бд? Я короче почитал про всякие и пришел к выводу, что Foundationdb самая пездатая, гибкая и все такое. Ща читаю по ней доки, сорцы. Оч хочу вкатиться в распределенные приложения в будущем, именно с этой бд. Только напрягает, что по ней одна вакансия всего на весь дс. В основном всякие кассандры, hbase и прочее говно мамонта. Скажите, велика вероятность, что ситуация изменится в ближайшем будущем? Учитывая, что порог входа для использования данной бд довольно высокий, т.к. по сути это очень сырое отсортированное key-value хранилище и нужно позалипать в доках недельку другую, чтобы разобраться, как с ним работать.
У нас в базе в качестве ID записи вместо простого порядкового числа используется строка формата sha1. Олды говорят, что это дает равномерное распределение данных по кластеру в процессе хранения и обработки.Как это понимать и для чего это нужно? Влияет ли это на скорость доступа или еще на что-то?
>>1456360Это в принципе правильное решение, потому что за счетчик айдишников обычно большая конкуренция в кластере. Как это вот все синхрогизировать, чтобы две записи с одинаковым ключом не сгенерились? Проще использовать UUID и проверять перед вставкой, чтотакого ключа в базе еще нет. С растущим интом такое тоже возможно, но в зависимости от степени конкуренции большая часть транзакций будет ретраится на этапе проверки, что такого ключа еще нет и производительность просто в 0 упадет.
>>1456382>Как это вот все синхрогизировать, чтобы две записи с одинаковым ключом не сгенерилисьСтавим триггер на добавление в таблицу записи - храним переменную со сцетчиком и увеличиваем. Разве это все не решается на уровне базы? >большая часть транзакций будет ретраитсяКажется я понял, спасибо, анан. Типо появится очередь за новым id'шником?
Подскажите как можно реализовать такую логику mysql. Есть таблица с полями id/user_id/token. При регистрации в этой таблице создается поле для пользователя. Если он решит выйти и снова авторизироваться, вместо новой записи в таблице должна обновляться старая запись. Я пробовал сделать это через INSERT INTO t8rv0_mobile_tokens (user_id, token) VALUES (:user_id, :token) ON DUPLICATE KEY UPDATE user_id = values(user_id), token = values(token)Но, видимо из-за того, что токены различаются, оно создает новую запись вместо обновления старой.Так же вопрос. Сам объект пользователя сохраняется в другой таблице. Если я слинкую user_id двух таблиц, оно создаст мне записи под все id? Тогда можно было бы заменить INSERT на UPDATE и пофиксить проблему
>>1456457Мы вообще сейчас о распределенной бд говорим? Если нет, то это действительно просто и решается на уровне базы (по сути обычный AtomicInteger). В распределенной бд все сложнее намного. Нужна либо лочка по счетчику (а для этого нужен консенсус, который сильно бьет по производительности), либо optimistic concurrency control, который и будет ретраить большую часть транзакций. Допустим у тебя 20 транзакций одновременно вставляют строку в базу, только одна из них пройдет. Потом из 19 только одна пройдет и т.д.
>>1456607Все понятно. У меня не распределенная. Вообще, зачем нужны распределенные базы?Типа когда у нас сервера разбросаны по всему миру для высокой скорости доступа всех пользователей и на каждом один экземпляр базы?
>>1456563Не стал вникать в твою проблему, сейчас стрельну вслепую, может попаду>ON DUPLICATE KEYПосмотри что у тебя выставлено в качестве ключа
Есть 2 вопросаПолгода работаю "Дата инженером " - в основном трансформирую данные с 2х баз данных, а также разбираю созданные экселевские отчеты / цсвшные репорты которые мне присылают в новые базы. Иногда в юпитер ноутбуке разбираю и чищу данные -> скидываю ноутбук чувакуЯ занимаюсь говном, то есть это и есть тот самый дата engineering? - это первый вопросПочитал вакансии - вон, люди красиво визуализируют данные и в табло, я на начальном уровне какой-то дешборд построить могу, есть чему учитьсяА чем ещё дата инженеры занимаются? - собсна вот такой второй вопрос
Кто-нить знает как впараше поиск людей работает? Ну типо, можно написать имя человека, город, возраст, пол и еще хуеву тучу другой инфы. Не стоит же у них индекс на каждую вариацию? Или стоит? Ну скажем если я ищу людей по универу, с какими-то доп. параметрами, то можно сначала найти всех из этого универа и уже их линейно просканировать на соответствие другим параметрам. Но скажем я ищу олегов из дс, которым 31 год. Олегов дохуя, людей в дсе дохуя и тех, кому 31, тоже дохуя. Как вот это сделать?
>>1457034Может партицирование по регионам?Если указываешь вузик, то регион по нему изи определить.Ну, а если просто возраст, то рандомных Олегов 31 летних.Хотя как количество записей так быстро воззращается.хз, кароч
Дайте, пожалуйста, ссылку на рабочий скрипт создания Northwind на MySQL. Всё, что нагуглил - у меня не работает, постоянно какие-то ошибки. Спасибо
>>1457648Короче, у меня вылазит ошибка ERROR 1366 (HY000) at line 175: Incorrect string value: '\xF3n 222...' for column 'Address' at row 1Пробовал делать то, что гугл советует - не помогло (или не так искал). Надеюсь на помощь местных гуру.
>>1457034>Не стоит же у них индекс на каждую вариацию?Индекс разве не просто на поля ставится без перебора вариаций?
>>1456714Etl, отчетность, администрирование субд - вот и все, собсна.Однажды приходит понимание, что этого мало, например, нужно тебе по апи что-то откуда-то скачать, учишь язык какой-нибудь, хотя бы PowerShell. Потом оказывается, что какие-то данные хотят не загружать к тебе в бд, а редактировать прям в ней - понимаешь, что нужно приложуху для этого запилить, да чтоб у всех работало - учишь фронт, чтобы нашлеать формочек.Потом данных уже много, хотят по ним прогнозы строить - вкатываешься в эконометрику (или как ща модно называть - МАШИН ЛЕРНИНГ), делаешь всякие там регрессии на ПАЙТОНЕ
>>1459669В гуглеЕсли твоя сущность - жопА, то называешь таблицу ЖопАЕсли твоя сущность - жопЫ (явно указывает, что список жоп, а не одна), называешь таблицы ЖопЫВ любой нормальной книжке про ДБ это будет где-нибудь написано. Откуда я это взял, я уже не помню, но весь мой опыт (20+ лет) показывает, что множественное число там, где сущность описывает ОДИН объект, - признак говеной системы (от ЕРД до кода).остальные конвенции - кэмелКейс или подчеркивания - это внутренние соглашения.и да, характерный признак пидора - использование зарезервированого слова в названии таблицы или полядругой характерный признак пидора - неименованные констрейнты (фк без имен и пр.) - ты их потом не удалишь нормально.
>>1459957Очевидно же, что нет.Если в одной строке твоей таблицы хранится информация об одной жопе - то таблица называется "жопа".Если сразу о нескольких - то "жопы".
>>1459959Приведи пример, в котором у тебя в табличке хранится информация для одной жопы. Непонятно, что ты имеешь в виду.
>>1459957>А может быть табличка, где всего одна жопа?Двачер познает мир, бля.Может быть табличка, где вообще ни одной жопы нет.Если тебе это непонятно, то рановато за соглашения об именования браться.Надо что-нибудь попроще
>>1460041Ну что ты, анончик!Вопросы по сиквелу надо задавать в питоно- и жс-тредах.Хули ты издалека заходишь?Есть вопрос - задавай.
>>1460048Загадали мне загадку, которую никак не могу раздуплить. Основная сложность в том, что если человек перемещался между станциями в последовательности 1-2-3-1, то как вот отловить минимальное время второго захода на станцию 1?
>>1460091Че делать то, анон? Я пока нафигачил вот так. Верно хоть иду? Дальше, поди надо какие-то сравнения сделать через CASE? Или я вообще хуйни наворотил, и решать надо не так?
>>1460073Твоя "основная сложность" обходится простым способом - тебе нужно посмотреть на предыдущую запись по времени для данного абонента и если БС в ней другая, то выбрать дату и время, иначе взять null.Попробуй рекурсивные запросы, почитай про LAG/LEAD, можешь попробовать решить с подзапросами - способов тут несколько.
>>1460107 Это будет не скоро, потому что мой SQL исключительно базовый. Пока разберусь, как это работает, несколько часов точно пройдет, но как решу, запощу. Или если не решу, завтра опять приду помощи просить. Надо решить к понедельнику мне эту загадку
>>1460053Что там написано про "необязательно решать за один"?Не обязательно одним запросом?Хули тогда, отсортируй данные по юзеру, времени, потом в процедуре цикл напишиВ результате требуется _построить таблицу_
>>1460099Нет. Это не пиздец.Если все понимают, что означает Cheburashka, то так и надо называть. А не пытаться искать перевод.Самый пиздец - названия по-русски БЕЗ транслита. Просто по-русски.Видел оракловую базу в солдиной компании, где половина таблиц называется "пользователь" и "счет", а другая половина - по-английски латиницей.
>>1459963Да блядь, таблица о сущности "жопа".А если это таблица, в которой несколько столбцов вроде "ширина", "глубина", "количество хуев", то называть ее верно будет жопа_properties.Но если ты решишь сделать её вертикальной и у тебя в этой таблице свойств будут строки типа "жопа, глубина, 15", "жопа, ширина, 10", "жопа, хуи, 42", то назвать ее надо "жопа_property".Верно тебе говорил анон, что ты просто ещё не дошел до этого, раз не понимаешь такие простые вещи.
>>1460158Ага, не обязательно решать за 1 запрос, возможны промежуточные таблицы. Он и так вроде отсортирован по юзеру и времени. Посмотрю и про циклы, спасибо
>>1458125Ну окей, поставил ты индекс на город, имя и т.д. И вот тебе приходит запрос:Найти всех Олегов из ДС которым от 31 до 35 лет. И че блять? С этими индексами ты можешь быстро найти либо всех Олегов (а ВК еще как - то учитывает написание, то есть там Олег, Олежко, Олеган это все одни имена), либо всех, кто живет в ДС, либо тех, кому от 31 до 35 лет. После этого тебе надо линейно сканировать весь результат на соответствие другим фильтрам. Понятно, что это пиздец как медленно учитывая кол-во пользователей Впараше. Плюс у них еще распределенная БД, поэтому добавляется еще задержка на передачу пакетов от кластеров БД к серверу. Как у них так получается быстро сука все искать блять? Я тоже так хочу уметь. Понятно, что у них как - то еще пагинация юзается, то есть они не возвращают тебе сразу весь результат (и не считают его разом на сервере). Но блин, даже допустим если у нас пагинация в 50 элементов. Сервер находит всех Олегов (допустим), начинает бежать по результату поиска, пока не наберет 50 Олегов, соответствующих фильтру (ДС и возраст 31-35). Это все равно будет пиздец как долго мне кажется. Ну а скажем если я поменяю в запросе ДС на мухосрань. Тогда наверное выгоднее будет в начале найти людей из мухосрани и уже их линейно сканировать. Короче, я думаю, что они действительно юзают индекс на каждую колонку. Но они не просто тупо его применяют как в sql запросе (WHERE a=x AND b=y AND c=z), а ведут какую - то статистику по каждой из колонок. Наверное, в эту статистику входит кол-во записей, у которых в этой колонке стоит такое - то значение. Допустим людей из ДС дохуя, а из мухосрани мало. Тогда БД уже может в начале применить индекс, который максимально сузит круг поиска (то бишь индекс по городу, в случае мухосрани). А потом уже просканирует этот результат и вернет 50 людей. Или допустим я ищу какого - нибудь Лаврентия из ДС, тогда можно в начале применить индекс по имени.Но все равно непонятно, как это работает в случае с такими городами как ДС. И у этого решения я уверен есть куча граничных случаев, которые могут сильно загрузить сервер и ему придется сканировать весь результат, пока он не найдет 50 людей. Короче хз...
>>1460255>учитывает написание, то есть там Олег, Олежко, Олеган это все одни именаТы не поверишь, но бывают и индексы на функциюА еще бывает тейбл-партишенингА еще бывает кэшированиеКороче, до хера всего бывает.Вылези уже с двача, да почитай про оптимизацию хранения и оптимизацию выборки
https://jsfiddle.net/leomac/vhy04phz/ Помогите с тестовым, не врубаюсь как вывести последние 3 вопроса.
>>14610121) select p.name, p.surnamefrom people pwhere exists (select 1 from people_nationalities pn where p.person_id = pn.person_id and pn.nationality = 'RU')2) select a.name, a.surnamefrom actors awhere a.age = (select max(aa.age) from actors aa)fetch first 1 row only;fetch first - это оракловый синтаксис, у других вендоров свой.актеров с макс. возрастом может быть много.3) select p.name, p.surnamefrom people p join people_nationalities pn on p.person_id = pn.person_idgroup by p.name, p.surnamehaving count(pn.nationality) > 1;
>>1461001Разве что для проектов уровня лаба.В промышленном коде триггеры для этого не используются, исторические записи создаются в прикладном коде в нужных местах.
>>1461030https://stackoverflow.com/questions/17872691/sql-history-table-and-triggersКакая тогда их сфера применения?
>>1461049Во-первых, тот анон тебя наебал.Потому что за "прикладной код" он считает только то, что пишет лично он на своем сраном питоне.Процедуры вполне могут быть частью прикладного кода.Триггеры вполне могут использоваться для целей, что ты указал.С очевидными ограничениями (например, триггер, в общем случае, не узнает, какая сволочь удаляет запись).Во-вторых, триггеры могут использоваться для обеспечения целостности данных. В тех случаях, когда правила сложнее, чем просто ФК. Например, нельзя иметь четное число в поле А, если в таблице Х нечетное количество записей.Конечно, такие правила должны быть реализованы на стороне клиентского кода.Но все знают, что клиентский код пишут уебаны, не чурающиеся питона и пхп, поэтому доверять им нельзя.Посему в нормальной базе максимально закрываются возможность в нее насрать. Констрейнт это самый очевидный и простой способ, триггер - более сложный и редко нужный.Кроме того, бывают правила, которые проще и надежнее реализовать на триггере, чем надеяться на прикладных программистов (создал запись тут, обнови там).Другое дело, что это не очень прозрачно.Но, когда у тебя есть легаси система, где база одна, а прикладной код может быть написан не просто в разных архитектурах, но и на разных языках, у тебя особо и нет другого выхода - единственный общий знаменатель это именно база.
>>1461220спасибо,я уже несколько дней думаю над такой штукой,толи я чего то не понимаю, то ли еще чтоmanaged//cloud DB действительно выходят в разы дороже чем если просто арендовать железные сервера и самим на них строить кластер?
>>1461559Дороже потому что они тебе гарантируют отказоустойчивость.С тем что настроил сам и ебаться будешь сам когда упадет.
>>1461220Если все манипуляции с данными написать на хранимых процедурах, то легко можно обойтись без триггеров.
>>1461578Можно.За исключением триггеров для обеспечения целостности.Это относится к ЕРД, скорее, чем к прикладному коду. Как любой констрейнт.Но, опять же, у тебя могут быть пять процедур, которые модифицируют какую-то таблицу, и от этого должна добавляться запись в историю. Сразу вопрос: что лучше, проще, надежнее и удобнее:1. написать один и тот же код в пяти процедурах?2. оформить этот код процедурой/функцие и вызывать ее из пяти процедур?3. подвесить один триггер?Для мне ответ очевиден, если триггер позволяет реализовать все, что мне надо в истории.
>>1461831Я с тобой согласен, все верно, с той лишь оговоркой, что если данные меняются исключительно через хранимки, то сложные констрейнты (типа количества актуальных в один момент записей, проверки допустимости значения в зависимости от содержимого в другой таблице и т.п.) реализованные в процедуре проще в сопровождении и в отладке, чем вариант с триггерами - но ты и сам сказал выше, что это не очень прозрачно.Если идет речь об истории, то я бы выбрал вариант 2, т.к. это позволит не писать пять разных апдейтов. Кроме того, триггер не имеет доступа к переменным хранимой процедуры (в оракле точно, предположу, что и в других субд тоже), придется пробрасывать все необходимое окольными путями. Но и тут не отрицаю, что в ином случае триггер может оказаться удобнее.Если отвечать на вопрос анона >>1461001То да, нормально, есть такой подход и он вполне рабочий.
>>1406455 (OP)Помогите, пожалуйста. Никак не могу придумать как нормально задизайнить таблицу. Грубо говоря, есть объект Message и у него есть поле action_type т.е. возможные значения этого поля уже известны заранее). В зависимости от этого поля, меняется структура полей, которые нужно хранить.Как нужно задизайнить схему, чтобы можно было хранить это все в каком-то связанном виде?
>>1461934Можешь завести нужные поля в Message для всех action_type, если их число жестко определено и не будет меняться. Можешь сделать EAV (см. Entity-Attribute-Value). Можешь оставить в Message общие поля, а остальные разнести по разным таблицам. Зависит от природы данных и твоих задач - насколько велик справочник action_type (3 значения или 30), будет ли он изменяться пользователями,предполагается ли поиск по различающимся полям, участвует ли таблица в тяжелых запросах, будет ли изменяться структура полей. У каждого решения есть плюсы и минусы.
>>1461868Да. об этом я писал где-то выше.Увы, нельзя все и сразу сделать хорошо. Чем-то где-то придется пожертвовать.
>>1461975Я бы сказал, что если общее число уникальных для каждого типа полей невелико, то надо их все в одну таблицу пихать.Оверхед на пусоту в записях будет невелик, а удобство написания и выполнения запросов вырастет в разы. Про адпейты и делиты не говорю уж.Ну и, опять же, будет гораздо удобнее месседж одного типа превратить в месседж другого руками.Есть одно но - как правильно поддержать целостность данных - not nullы требуемые лишь для одного типа, и как не насрать в поля, этому типу нехарактерные.
>>1461559Суммарно за все время - конечно больше, в ближайшей перспективе - нет.Как написал оратор выше, плюс ко всему облако подразумевает отказоустойчивость.
>>1462194>облако подразумевает отказоустойчивостьПока оператор не обанкротился, ркн не закрыл доступ, хуй знает кто не влез в твои данные, и т. д.Вам дай волю, вы и мамку свою в облако запихнете
>>1460343На работу устроюсь сперва, потом обязательно запощу. Пока что могу сказать, что работу приняли, сказали "малаца", сегодня следущий этап собеседования
В одной таблице хранится два типа документов, которые связаны между собой. Нужно сделать селект по type1.status и type2.status. Как это сделать?
>>1462653Анончик, если хочешь получить хороший ответ - задавай хороший вопрос. Например, структуру таблицы напиши, что с чем связано и по какой колонке, что ты хочешь выбрать.Имей уважение к людям, не пости несвязный бред.
>>1462707Есть две таблицы. Все документы хранятся в DOCUMENT, а связи между ними - в BIND. Например, первая запись в BIND - это документ с id 333 из DOCUMENT, который связан с документом 111. Мне нужно получить список связанных пар документов с определенными статусами. Пример: из пикрила мне нужно получить пару (или несколько пар) связанных документов, у которых у первого TYPE=ebalo, STATUS=vsrato, а у второго TYPE=hui, STATUS=tiny. Надеюсь, понятно раскрыл вопрос.
Аноны, помогите кусок запроса составить. Вот кусок схемы таблицы. Нужно во вьюху вытянуть конкретный user_properties.key в качестве поля, а в качестве значения поля нужно вытащить user_properties.value.string_value из record user_properties.value
>>1462726Тебе нужно заджойнить document с bind по global_id, а затем bind снова заджойнить с document но уже по doc_id. Затем написать условие where для ведущих и связанных документов, различить их помогут алиасы.Читай про inner join, where. В разборе join обрати внимание, как используются алиасы для таблиц. Пиши код, пробуй.
>>1462728Какая у тебя СУБД? Как ты пробовал решить самостоятельно? Что именно вызвало затруднения? Документацию читал?
>>1457034Бля, понял!Они просто сливают всю инфу по пользователю в одну строку и ее индексируют. Вот так короче
>>1460255Почитай, как работают колоночные индексы. Они строятся не по каким-то столбикам, а в целом меняют структуру хранения данных в табличке.
>>1463407Пощады, там в базе всего несколько миллионов строк(смехота), собранная статистика и хороший оптимизатор запросов - вот и работает все быстро.Да и фетч происходит порциями, а не всех строк сразу.
>>1463580Индексы columnstore — это стандарт хранения и запрашивания больших объемов данных в таблицах фактов. В этом индексе используется хранение данных и обработка запросов по столбцам, что позволяет практически в 10 раз увеличить производительность запросов к хранилищу данных по сравнению с традиционным хранилищем, в котором данные хранятся по строкам, и практически в 10 уменьшить размеры данных по сравнению с несжатыми данными.https://docs.microsoft.com/ru-ru/sql/relational-databases/indexes/columnstore-indexes-overview?view=sql-server-2017
Аноны, ньюфаг в треде, такая задачка, нужно вывести id предпоследнего нанятого сотрудника, используя подзапрос.Наваял вот это, но не работает, так как типа ничего не известно о subQuery (какого черта, я же подписал). Помогите, кто чем можетSELECT EmployeeIDFROM (SELECT EmployeeID, HireDateFROM EmployeesWHERE HireDate < (SELECT MAX(HireDate)FROM employees)) AS subQueryWHERE HireDate = (SELECT MAX(HireDate)FROM subQuery);
>>1464055Потому что нельзя обращаться в подзапросе к блоку запроса выше таким образом. К его полю - пожалуйста, но не селектить из него.select coalesce((select id from (select id from employees order by hiredate desc)where rownum = 2),(select id from employees)) --from dualМне после оракла кажется безумным такой запрос без from dual, но если бд другая - нужно без него.Берешь второго по hiredate сотрудника, если такого нет - то он всего один, выводишь его.Если задача подразумевает, что если сотрудник один, то ничего не выводить - то тебе нужен первый аргумент coalesce только.
>>1406455 (OP)Господа, не подскажете, в каких случаях distinct работает быстрее group by в posgres?Я читал где-то, что distinct всегда под капотом юзает group by, так ли это?Есть у кого бенчмарки или примеры, линканите, плиз
>>1463698Цитаты из документации на русском языке...ОоооокЭто, конечно, все очень хорошо. Только columnstore index это не индекс даже в понимании МСЕсли ты там повыше поднимешься в этой доке, то увидишь, чтоAn index is an on-disk structure associated with a table or view that speeds retrieval of rows from the table or view. An index contains keys built from one or more columns in the table or view. These keys are stored in a structure (B-tree) that enables SQL Server to find the row or rows associated with the key values quickly and efficiently.А в описании колумнсториндекса будет написано:A columnstore index is a technology for storing, retrieving, and managing data by using a columnar data format, called a columnstore.Так что слово "индекс" там только в названии. Типа "морской свинки".Но ладно, настаивать, что ты не прав, не стану.
>>1464092Distinct - это group by по всем полям с сортировкой, потому работать будет дольше, тут и за тестами не ходи.Union, minus, intersect - та же шляпа, по факту.
>>1464471>Distinct - это group by по всем полям с сортировкойКонечно же, ты сейчас приведешь выдержку из документации, которая подтверждает это безумное утверждение, да?Конечно, нет.
Анончик-программист, помоги разобраться. Ситуация:Скрипт на VBS отправляет запрос Q к MS SQL Server 2008R2 посредством ADODB (Provider = "SQLOLEDB").Q = "SELECT DISTINCT A FROM Table"В результате исполнения ADODB.Recordset возвращается пустой.Этот же запрос Q, исполненный в MS SQL Server Management Studio возвращает 51 строку.Таблица содержит кириллицу и в наименовании столбцов и в полях.Момент: если из Q убрать DISTINCT, ADODB.Recordset возвращается непустым.Вопрос: почему реакция ADODB на ключевое слово DISTINCT кардинально отличается от реакции самого SQL Server?
Тут давеча на хабре нашел статейку, там чел с пруфами вроде как пояснил, что UNION быстрее будет отрабатывать, нежели OR. Правда шоль?
>>1464804От случая к случаю. Если у тебя в OR стоят условия на индексированные поля и оптимизатор может раскрутить этот запрос на union с этими условиями, то да, это будет быстрее и он выберет этот вариант. То есть пишешь OR, а на самом деле получится два чтения индекса.А если поля не индексированные, то в одном случае у тебя два чтения таблицы и проверка одного поля, а во втором одно чтение таблицы и проверка двух полей - больше затрат CPU.Если таблица широкая, то вариант с OR предпочтительнее, чтобы ценой вычислительных затрат уменьшить количество чтений с диска, если в таблице 1-2 столбца(условно, конечно - может, в пределах 10-15 столбцов в зависимости от типов данных), то в самом деле будет быстрее прочесть дважды таблицу и сделать union.Вангую, что при написании статьи тот парень использовал тестовую среду или домашнюю базу, в которой из буферного кэша(сиречь место в оперативе, где какое-то время хранятся доставаемые с диска блоки, чтобы можно было быстро обратиться к ним повторно) никто другими запросами не вытолкнул его таблицу. На боевой базе такое вряд ли получится.
>>1464302Вопрос был в том, как у вк устроен поиск. Есть термин - кологочный индекс. Ты доебался до его названия, умница. По существу есть, что сказать?
>>1464913>По существу есть, что сказать?Конечно: ты тупой мудак, который не понимает, о чем говорит с умным видом.Ты даже на дваче умудряешься обосраться, знаток баз данных.Послезавтра к первому уроку, не проспи.
>>1465491Там датасайнтисты, вроде бы. А меня больше интересует сам процесс обработки и подготовки больших массивов данных под задачи этих ребят.
>>1466015Какие знания нужно иметь, чтобы попасть джуномидлом к вам? Во всяких спарках и хадупах дома полноценно не поразбираешься.Есть пара лет опыта в бэкенд-разработке
Анонче, на что он ругается? Я уже голову сломал.CASE CP_LastInstallationErrorwhen '8007045D' then 'Delete all SCCM folders and rebuilt wmi Repository'when '-2147023174' then 'Check out firewall or AntiVirus'when '2147024891' then 'NONE'END AS 'SOLUTION'ERROR: Conversion failed when converting the value '' to data type .Я только недавно вкатился и учусь писать запросы, пока что.
>>1467244помимо хадупчика с питончиком есть и дургие технологии:MS SQL + SSIS, например.Куда приятнее и понятнее лично мне, используется для наполнения хранилищ данных.>>1467746>Conversion failed when converting the value '' to data type .to data type КАКОЙ? нахуя ты обрезал последнее слово из ошибки?Ты уверен, что проблема, вообще, в этой части запроса? Пробовал выполнить запрос с селектом только одного этого кейса?
>>1467776Там ошибка такая, он астериски не показал, просто.Изначально, выглядело это так: the value to data type .Пробовал кейсы по одиночке, а результат был тем же.
>>1469131Тут спрашивай, что хотел.Аналитики, которые рисуют отчеты, тут. Сам такую должность занимал пару лет назад, да и сейчас этим занимаюсь факультативно.
Извечный вопрос об оптимизации запросов.Что лучше: сделать 2 SELECT в SQL и программно ужать в программе, или сделать один SELECT + JOIN?Интересует именно нагрузка на SQL
>>1469756Второе. Потому что СУБД может знать о твоих данных такие вещи, о которых ты со своим кодом не подозреваешь.
>>1469764Только эффект может проявиться при накоплении статистики, поэтому ньюфаги с синтетикой на чистой базе могут объебаться.
>>1469475Как в таких аналитиков вкатиться?Я двухмесячный курс на курсере по анализу данных прошёл, но на собеседованиях меня нахуй посылают. Вот только и пишу постановочки-таски
>>1469912Нужно уметь 3 штуки:1. Понимать требования и быстро вкатываться в то, что от тебя хочет заказчик. На собеседовании могут предложить решить алгоритмическую задачку, чтобы это чекнуть. Без шуток они бывают сложными. Есть 2 яйца и 100-этажное здание, яйца бьются с какого-то определенного этажа (один и тот же этаж для любого яйца). За какое минимальное количество бросков яиц можно понять, какой это этаж?2. Уметь в язык запросов, самое распространенное - SQL. На собесе 100% дадут решать запросы: для каждого менеджера выберете 3 самых продаваемых товара. 3. Уметь визаулизировать данные - PowerBi, Tableu, SSRS и т.п.На собеседовании никак не чекают.
В общем, подаюсь на работу.В вакансии основным и жирным выделенным были SQL и Power BIКакие бы Ты, Анон, поставил мне вопросы?Позиция для начичнающего.
>>1470580Первым делом я бы дал тебе тест на знание скл с вопросами типа этого (п.1, п.2)>>1470149Всякие там join, apply, unionПотом бы поспрашивал про PowerBi, раз ты его жирным выделил:Какие есть режимы работы отчетов, чем они отличаются.Собственно, все. От рисователя отчетов много и не требуется.
>>1470800> Собственно, все. От рисователя отчетов много и не требуется. А денег сколько платят такому рисователю?
>>1460343Кароч меня берут. Как обещал, выкладываю решение/ Нельзя просто взять и сгруппировать станции, потому что пользователь может на них вернуться, и тогда я потеряю время второго захода. Мне нужны уникальные идентификаторы сессии пользователя на каждой станции, по ним я вычислю самое раннее время активности пользователя при каждом заходе на каждую станцию /WITH rank_data AS( SELECT id, bs, time, RANK() OVER (PARTITION BY id, bs ORDER BY time) AS bs_hit, -- Проранжирую каждый хит пользователя на каждой станции RANK() OVER (PARTITION BY id ORDER BY time) AS user_activity -- Проранжирую все хиты пользователя по всем станциям FROM `database.test.bigdata` ORDER BY time),sessions AS ( SELECT id, bs, time, bs_hit, user_activity, user_activity - bs_hit AS session_id -- Получу уникальный идентификатор сессии пользователя на станции FROM rank_data ORDER BY id, time),/ Соберу в отдельную таблицу время начала каждой сессии на каждой станции /session_start AS ( SELECT DISTINCT(id), bs, MIN(time) OVER(PARTITION BY id, bs, session_id ORDER BY id, time) as time FROM sessions ORDER BY id, time),/ Соберу в отдельную таблицу время последнего появления пользователя на станции, последнее время сессии мне не интересно по условиям задачи /leaving_station as ( SELECT DISTINCT(id), bs, MAX(time) OVER(PARTITION BY id, bs ORDER BY id, time DESC) as timeFROM sessionsORDER BY id, bs)/ Вывод требуемой траблицы /SELECT session_start.id as ID, -- идентификатор пользователя session_start.bs as BS, -- базования станция session_start.time as time_start, -- начало сессии на станции CASE WHEN LEAD(session_start.id) OVER(ORDER BY session_start.id, session_start.time) = session_start.id / Если идентификатор пользователя на следущей строке тот же, что и на предыдущей, то конец его сессии на одной станции равен началу сессии на следующей / THEN LEAD(session_start.time) OVER(ORDER BY session_start.id, session_start.time) ELSE / Иначе: конец сессии - это конец активности пользователя на станции / leaving_station.time END AS time_end FROM session_startLEFT JOIN leaving_stationON session_start.id = leaving_station.id AND session_start.bs = leaving_station.bs
>>1471038В ДС ~ 100к/месяцСам участвовал в составлении вакансии.Тока sql надо правда хорошо знать, а не врать, что хорошо знаешь.
>>1406455 (OP)Анон, есть одна таблица в бд на mssql2016, в ней varchar(1000) поле, внутри которого json, по полям которого нужно искать с помощью json_field(column, '$.someField').Но такая функция появилась только в mssql2016, а нам на один из новых боевых контуров могут дать только mssql2014.Нет ли у тебя реализации чего-то вроде json_field на чистом tsql?
Аноны, бизнес/системные аналитики тут водятся?Я закончил год назад вуз по прикладной информатике в экономике и это вроде как раз оно - основной упор на автоматизацию бизнес-процессов с помощью баз данных. Был во время учебы и олимпиадный опыт на командном всеросе, когда за несколько дней по данной условием теме стартапа моделировали бизнес-процессы as-is, оптимизировали и придумывали to-be с проектом автоматизации, потом проектировали БД и реализовывали прототип и представляли "якобы инвестору".Вот только цепочка развития такого специалиста и должности мне пока не до конца понятны и плюс названия должностей везде разные. В разработке у программистов всё довольно понятно - выбираешь язык и идешь джун-мидл-сеньор, и где-то на уровне опытного мидла можно пытаться потихоньку уехать за рубеж. А тут есть бизнес-аналитики, есть системные аналитики и просто аналитики, есть всякие продакты, архитекторы и просто, наконец, разработчики БД.Вопроса основных два (спасибо, кто прочитал до конца):1. Как примерно строится обычно рост?2. Насколько всё хуёво с возможностью переезда по сравнению с разработчиками? Я пока никчёмный хуй с горы, но когда-нибудь очень хочется завести трактор, может лучше сразу пытаться перейти на разработчика или, упаси Боже, дата саентиста? (кстати, очень похожая на дата саенс математика у меня в обилии была в вузе, только я многое уже забыл)Спасибо, аноны, заранее за ответы. Нахуй тоже схожу, если пошлёте.
>>1471755>Я пока никчёмный хуй с горы, но когда-нибудь очень хочется завести трактор, может лучше сразу пытаться перейти на разработчика или, упаси Боже, дата саентиста?Вы принятыСвободная касса
>>1471755Бизнес/системные аналитики это документная хуита, где описывать словами программы в 100 раз больше, чем строчек кода в твоей работе
Сап, аноны, нужна помощь с хитрым (для меня) запросом.Нужно вывести таблицу, содержащую имя курса (course.name) и кол-во человек, прошедших соответствующий курс за условный период.Дата окончания хранится в history.cend, если history.status = 1, то курс считается пройденным. Т.е. сосчитать такие history.history_id, что history.cend=x и history.status = 1 для каждого course.name. Собственно на этом и застрял. Помогите пожалуйста. Структура бд пикрилейтед.
>>1471632Вакансия называется аналитик. Не еби себе мозги джунами мидлами и т.п.>>1471625>Sql Server 2014Поддерживает CLR.Так что советую написать на C# парсер джейнсона и встроить получившуюся либу в SQL Server в виде сборки (Assembly). Получится то же самое, что умеют функции JSON_VALUE и JSON_QUERY в Sql Server 2016. Если с этим проблемы, могу помочь.
>>1472083> CLRПосмотрел и отказался - усложнит и без того неидеальные сборку и деплой с версионированием. Но все равно спасибо.Решил написанием скалярной фции, которая работает только с моим частным случаем.
>>1472048Я бы сделал вот так:select c.name, COUNT(h.trainee_id)from history hleft join course con h.course_id = c.course_idwhere h.cstart = my_start_date and h.cend = my_end_dateand h.status = 1group by c.nameанон, учти - я полнейший нуб. завтра иду на собес. надеюсь, что меня не обоссут с ТАКИМИ ЗНАНИЯМИ SQL
>>1472181А не подскажешь ещё, как вывести ВЕСЬ список курсов (course_id) в первом столбце, а во втором все так же?
>>1472088Ну да. Тока скалярные функции у тебя убьют многопоточность навсегда и твои запросы будут работать миллиард лет.А CLR позволит работать в многопоточном режиме.
Хай БД, нужна литература по созданию реальной БД для клиент-серверного приложения (тупа в C# накидаю формы). А то создаю БД, но все не то (MYSQL).
>>1472467Бд для турфирмы. Условно базы отдыха могут предоставлять жилье и развлечения и еще что нибудь (по прайс листам), цена на жилье может быть варьироваться от дня недели, каникул и т.д.Есть музеии которые просто предоставляют что-то одно.А некоторые турбазы предоставляют вертолет самолет параход и нужно знать что за модель и сколько вмещает эта техника людей.Питание как и жилье может быть при парке как услуга или в отдельном заведении.
Какой нормальный софт есть для рисования UML и ER диаграмм. Чтоб бесплатно (не возиться с кряками), не тяжелый (гигабайты качать-ставить нет желания), не онлайн (ну или чтоб веб-версию можно было сохранить и использовать автономно) ? Генерация sql желатеьна но не обязательна.В интернетах сотни решений, но либо онлайн, либо платное монстроузное. А пробовать все подряд - времени нет.
Почему все так обожают Oracle DB?Обычная бд как бд, как postgresql или MysqlПросто дороха.Это ведь как бренд Apple
>>1472502Тебе не нужна литература по БДОна тебе не понадобится до тех пор, пока ты не сможешь на человеческом языке хотя бы для тебя сформулировать задачуПросто садишься и расписываешь на бумажке, что и как бывает у тебя в жизни, и что с чем связано
>>1473634>Oracle как mysqlАхахахахахахаВсе так, анон, все так.Вообще на монгу переходи, все классные поцаны уже ее пользуют
Может ли быть 2 FK на одну и ту же таблицу? Нопример:Table Battlebattle_id: bigintplayer1_id: bigintplayer2_id: bigintmap_id: bigintbegin_time: timestumpend_time: timestumpresult: enum("player1_won", "player2_won", "draw")Вот если мне надо чтобы 2 игрока были оба из таблицы(но разные записи) "player". Так можно?
>>1477475Это MySQL ?Можно:create table Battle (...b_player1_id INT NOT NULL,b_player2_id INT NOT NULL,...foreign key(b_player1_id, b_player2_id)references player(player1_id, player2_id))Вполне возможно, что я обосрался. Тут уже извини
Хотел спросить тут. Вычитывал понятие "Хорошое знание маскуэл/постгресс". Вот вопросы: в чем сложность баз данных? Что там изучается такого на отдельную категорию? Что отличает хорошего базданщика от плохого?Ну хранится там инфа по столбцам и что дальше?
>>1478187Ничего, в принципе, смело можешь идти на собеседование. Главное, что ты знаешь, что в базе хранится инфа по столбцам, в 99% этого хватает, чтобы взяли.
Я не понимаю, почему обычный индекс для текстовых полей в монге работает медленно, а текстовый индекс для полнотекстового поиска работает быстро.
>>1478315Вообще запрос выглядит как $or по всем полям с каким-то текстовым значением. Про медленные индексы в интернете пишут.
>>1479912За эту цену - говно.Я в резюме на хх просто ссылку на профиль вставил 7 лет назад, кому надо было - смотрели сами.
Привет! Есть учебная задача: реализовать базу данных на ~20 таблиц + клиент-серверное приложение для доступа к ней.Язык важен, концепция (реляционная бд или NOsql) тоже. Пока что есть идея сделать реляционную базу данных и приложение на питоне в силу его простоты (работал с питоном немного, но бд на нем не трогал). Насколько я знаю, в питоне есть встроенная поддержка SQLite. Стоит ли пользоваться им или лучше накатить какую-нибудь SQLAlchemy и делать через нее? У кого есть опыт такой разработки? Какие подводные? Какие можете дать советы?Буду рад любой критике/комментариям, спасибо.
Сап, датабазычи.Есть один проект в котором надо хранить реальный граф (пока маленький, около 10-15к строк). В процессе появления первой версии, родилось решение и использованием Postgres, и для уже сейчас DAO слой вышел достаточно нагруженным - граф вытягивается по 4 таблицам (таблица с метаданными по графу, таблица с гранями, таблица с узлами, таблица с метаданными по узлам), вместе с кучкой промежуточных преобразований в коде. В последствии будет ещё больше, например n2n связь между узлами и графами или вложенные графыВозникла идея перевести все на графовую БД (пока смотрю на neo4j и dgraph). Есть здесь у кого-нибудь опыт использования такой вуду-техники? Был бы рад увидеть сравнения или отзывы
>>1481709Fix. В начале речь идёт не о размере графа, а о размере проекта. Собственно, графы большого размера не ожидаются, так что в произвольность постгри я скорее всего не упрусь. Другое дело - сложность поддержки кода
>>1481709использовал нео4ж в связке с реляционной базойхранил деревья: информацию о графе в нео, всю информацию об объектах - в реляционнойкак только выяснил, что деревья у меня не могут быть глубже 5 уровней, выкинул на хер неов паре мест пятиэтажные селекты (был какой-то мускл, поэтому без иерархических запросов)зато все аккуратно с транзакциями, не надо вытирать сопли за нео4ж, который время от времени что-то терял
>>1484166Тест для более - менее шарящих людей будет не сложным.Вряд ли потратите на него более двух часов (а скорее всего лишь час)Писать сюда [email protected]
USE testdata;DECLARE @i INT;SET @i = 0;WHILE @i < 10 DOSET @i= @i + 1;END;SELECT @i;Почему ругается на вторую строку? MariaDB
>>1487711https://mariadb.com/kb/en/library/declare-variable/Первая ссылка в гуглеА у тебя синтаксис скл сервера, если что
Суп программач. Подскажи неопытному, есть ли проверенный и правильный способ (алгоритм, метод, подход) для реализации графов в SQL базах данных. У меня postgres, если очень грубо, стоит задача реализации склада. Пример простой. Есть товар в штуках, штуки могут разделяться и объединяться, соответственно у каждого товара может быть как один так и много родителей (в случае если это объединение). Вот вопрос, как правильно сделать граф и не накостылять при этом. Спасибо.
Как реализовать if-then в запросе?ТипаIF (SELECT %возвращает булево выражение%)THEN UPDATE %что-нибудь%
Антуаны, посоветуйте, пожалуйста, что-нибудь толковое почитать про недостатки (и, возможно, достоинства) SQL/NoSQL СУБД. Интересует прежде всего набор граблей, который обязательно прилагается к SQL/NoSQL (ну там простая/нереализуемая горизонтальная масштабируемость, простая/геморная расширяемость и т. п.). Также приветствуются кулстори от всяких компаний, которые попробовали использовать <вставить название СУБД> для своих целей и дико облажались из-за недостатков 1), 2), 3) данной СУБД.