Дорогие мои Enterprise-гики, кто хочет вписаться в безумную...

Дорогие мои Enterprise-гики, кто хочет вписаться в безумную задачу? (Если что - нет, это не то, о чём были мои недавние посты.)

Ландшафт:
- Распределённая система в активной разработке - десяток компонентов, тяжёлые из них партиционированны, пишет это всё несколько команд.
- 200 000 сообщений в секунду, время обработки транзакции менее милисекунды (всеми компонентами распределённой системы, в сумме).
- Очень ответственный зверёк - в случае единичной продолбанной транзакции или простоя на проде куче людей будет *очень* больно.

Задача крупным планом:
Небольшой командой (~3 человека) за примерно год выстроить тестирование системы. Задача не про написание юнит-тестов - их и так пишут. Задача про отказоустойчивость, нагрузку, latency, jitter полной конструкции в ситуации сильной вариативности параметров как компонентов самой системы, так и инфраструктуры под ней. Система при этом в активной разработке, т.е. (а) она активно меняется, (б) на эти её изменения можно и нужно влиять.

По технологиям:
- Python (на нём писать своё)
- C++11 (на нём общаться с девелоперами)
- RHEL + RT kernel + IB (инфраструктура)

Технологии это must, но вообще *гораздо* важнее и сложнее:
- способность охватить взглядом и творчески курить конструкцию целиком
- способность находить общий язык с кучей смежных людей, которые делают свои части работы

Условия:
- Москва, офис, full time
- всё остальное лично

За деталями только в личку - в паблик больше написанного рассказать не могу.
My dear Enterprise geeks, who wants to fit into a crazy task? (If that is not, this is not what my recent posts were about.)

Landscape:
- A distributed system in active development - a dozen components, the heaviest of them are partitioned, all this is written by several teams.
- 200,000 messages per second, transaction processing time less than a millisecond (in total by all components of a distributed system).
- A very responsible animal - in the case of a single hollowed transaction or downtime on a prod heap of people it will be * very * painful.

Close-up task:
In a small team (~ 3 people) in about a year to build a system test. The task is not about writing unit tests - they are already written. The task of fault tolerance, load, latency, jitter of a complete design in a situation of strong variability of the parameters of both the components of the system itself and the infrastructure under it. The system is in active development, i.e. (a) it is actively changing, (b) its changes can and should be influenced.

By technology:
- Python (write your own on it)
- C ++ 11 (communicate with developers on it)
- RHEL + RT kernel + IB (infrastructure)

Technology is a must, but in general * much * more important and more complex:
- the ability to capture the look and creatively smoke the entire structure
- the ability to find a common language with a bunch of related people who do their parts

Conditions:
- Moscow, office, full time
- everything else personally

For details only in PM - in public I can’t tell more than what was written.
У записи 1 лайков,
1 репостов.
Эту запись оставил(а) на своей стене Алексей Васюков

Понравилось следующим людям