|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Добрый день уважаемые! Опишу ситуацию. Есть две идентичные платформы, с одинаковой архитектурой, почти с одинаковым железом и нагрузкой. Платформа представляет из себе коммутатор и сервер с БД на базе Informix. К БД постоянно висят 60 сессий с коммутатора, которые периодически читают данный о клиентах, пишут данные и т.д. Самая большая таблица в БД - CDR :p Также с БД работают пользователи. C 1-й платформа все ок. Блокировок нет, все шуршит... все довольны... Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97. 98. 99. 100. 101. 102. 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113. 114. 115. 116. 117. 118. 119. 120. 121. 122. 123. 124. 125. 126. 127. 128. 129. 130. 131. 132. 133. 134. 135. 136. 137. 138. 139. 140. 141. 142. 143. 144. 145. 146. 147. 148. 149. 150. 151. 152. 153. 154. 155. 156. 157. 158. 159. 160. 161. 162. 163. 164. 165. 166. 167. 168. 169. 170. 171. 172. 173. 174. 175. 176. 177. 178. 179. 180. 181. 182. 183. 184. 185. 186. 187. 188. 189. 190. 191. 192. 193. 194. 195. 196. 197. 198. 199. 200. 201. 202. 203. 204. 205. 206. 207. 208. 209. 210. 211. 212. 213. 214. 215. 216. 217. 218. 219. 220. 221. 222. 223. 224. 225. 226. 227. 228. 229. 230. 231. 232. 233. 234. 235. 236. 237. 238. 239. 240. 241. 242. 243. 244. 245. 246. 247. 248. 249. 250. 251. 252. 253. 254. 255. 256. 257. 258. 259. 260. 261. 262. 263. 264. 265. 266. 267.
С 2-й платформой беда... Постоянно висят блокировки, пользователи жалуются на Lock Timeout Exired... Проскакивают Deadlock's... Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50. 51. 52. 53. 54. 55. 56. 57. 58. 59. 60. 61. 62. 63. 64. 65. 66. 67. 68. 69. 70. 71. 72. 73. 74. 75. 76. 77. 78. 79. 80. 81. 82. 83. 84. 85. 86. 87. 88. 89. 90. 91. 92. 93. 94. 95. 96. 97. 98. 99. 100. 101. 102. 103. 104. 105. 106. 107. 108. 109. 110. 111. 112. 113. 114. 115. 116. 117. 118. 119. 120. 121. 122. 123. 124. 125. 126. 127. 128. 129. 130. 131. 132. 133. 134. 135. 136. 137. 138. 139. 140. 141. 142. 143. 144. 145. 146. 147. 148. 149. 150. 151. 152. 153. 154. 155. 156. 157. 158. 159. 160. 161. 162. 163. 164. 165. 166. 167. 168. 169. 170. 171. 172. 173. 174. 175. 176. 177. 178. 179. 180. 181. 182. 183. 184. 185. 186. 187. 188. 189. 190. 191. 192. 193. 194. 195. 196. 197. 198. 199. 200. 201. 202. 203. 204. 205. 206. 207. 208. 209. 210. 211. 212. 213. 214. 215. 216. 217. 218. 219. 220. 221. 222. 223. 224. 225. 226. 227. 228. 229. 230. 231. 232. 233. 234. 235. 236. 237. 238. 239. 240. 241. 242. 243. 244. 245. 246. 247. 248. 249. 250. 251. 252. 253. 254. 255. 256. 257. 258. 259. 260. 261. 262. 263. 264. 265. 266. 267. 268. 269. 270. 271. 272. 273. 274. 275. 276. 277. 278. 279. 280. 281. 282. 283. 284. 285.
Не могу понять в чем дело. Прикладываю скрин... Прошу помочь разобраться в ситуации... ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 10:42 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Вот скан второй платформы... ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 10:43 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Ситация сложная... блокировок слишком много. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23.
... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 12:04 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
число lokwaits косвенно указывает на возможную проблему, в нормальной системе с транзакциями это число всегда очень велико. Если пользователи не жалуются, значит все в порядке. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 12:18 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Журавлев Денисчисло lokwaits косвенно указывает на возможную проблему, в нормальной системе с транзакциями это число всегда очень велико. Если пользователи не жалуются, значит все в порядке. Я правильно понял, что ожидания блокировок не равно самим блокировкам? Тоесть счетчик, который меня пугает != самим deadlock? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 12:28 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Если проблемы из-за блокировок, возможно поможет перевод таблиц в row из page locking. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 12:28 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Часть таблиц я уже перевел на ROW, часть оставил как изначально было в PAGE. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 12:32 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
ДбашкабррЯ правильно понял, что ожидания блокировок не равно самим блокировкам? если было ожидание 1 наносекунду, пользователю наверно наплевать? ДбашкабррТоесть счетчик, который меня пугает != самим deadlock?дидлокс это несколько иное. В документацию. Вам полезнее смотреть на эту вкладку http://myinformix.narod.ru/scronmlcs.html ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 12:39 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Журавлев ДенисДбашкабррЯ правильно понял, что ожидания блокировок не равно самим блокировкам? если было ожидание 1 наносекунду, пользователю наверно наплевать? ДбашкабррТоесть счетчик, который меня пугает != самим deadlock?дидлокс это несколько иное. В документацию. Вам полезнее смотреть на эту вкладку http://myinformix.narod.ru/scronmlcs.html За этой картиной я пристально смотрю... и вот что вижу... список уходит далеко в низ :) ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 12:43 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Код: plaintext 1. 2.
... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 12:45 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
ДбашкабррЗа этой картиной я пристально смотрю... и вот что вижу... список уходит далеко в низ :)интересны только первые пять строк, где есть waiter ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 12:50 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Журавлев ДенисДбашкабррЗа этой картиной я пристально смотрю... и вот что вижу... список уходит далеко в низ :)интересны только первые пять строк, где есть waiter Как дальше анализировать полученные данные? ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 12:54 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Дбашкабрр Есть две идентичные платформы, с одинаковой архитектурой, почти с одинаковым железом и нагрузкой. Платформа представляет из себе коммутатор и сервер с БД на базе Informix. К БД постоянно висят 60 сессий с коммутатора, которые периодически читают данный о клиентах, пишут данные и т.д. Самая большая таблица в БД - CDR :p ... C 1-й платформа все ок. Блокировок нет, все шуршит... все довольны... Прошу помочь разобраться в ситуации... Настройки сервера все таки существенно отличаются. Почему ? Базы данных на серверах идентичные по структуре ? А по объему ? Я правильно понял, что на обоих серверах включена репликация ? Между собой или на другие сервера ? Проверяли ли железячные проблемы на втором серваке ? (например, может там в RAID-е диск выпал, может на сетевой карточке большой процент ошибок и повторов и т.п.) ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 14:22 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Дбашкабрр, там деревья блокировок получаются, просто не очевидно Код: plaintext 1. 2. 3. 4. 5.
т.е. надо посмотреть что делают 2460 и 2491 onstat -g ses 2460 onstat -g ses 2491 или прямо онменеджером ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 14:37 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
vasilisДбашкабрр Есть две идентичные платформы, с одинаковой архитектурой, почти с одинаковым железом и нагрузкой. Платформа представляет из себе коммутатор и сервер с БД на базе Informix. К БД постоянно висят 60 сессий с коммутатора, которые периодически читают данный о клиентах, пишут данные и т.д. Самая большая таблица в БД - CDR :p ... C 1-й платформа все ок. Блокировок нет, все шуршит... все довольны... Прошу помочь разобраться в ситуации... vasilis Настройки сервера все таки существенно отличаются. Почему ? На 1-м сервер проблем не наблюдается и конфигурация очень старая. На 2-м я пытался менять настройки в целях оптимизации... vasilis Базы данных на серверах идентичные по структуре ? Да 1:1. vasilis А по объему ? Нет. На первом объем БД 7.8 Гб На втором объем БД 9.6 Гб. Активных клиентов больше второмом сервер. vasilis Я правильно понял, что на обоих серверах включена репликация ? Между собой или на другие сервера ? Никакой репликации. Сервера в локальной сети. vasilis Проверяли ли железячные проблемы на втором серваке ? (например, может там в RAID-е диск выпал, может на сетевой карточке большой процент ошибок и повторов и т.п.) Да проверял. Linux никаких ошибок не сыпет, все хорошо. На втором серваке 5-й рейд с 3 дисками. MegaRAID LD 0 RAID5 138G Version: 515H На первом просто винты SCSI device sda: 144410880 512-byte hdwr sectors (73938 MB) SCSI device sdb: 144410880 512-byte hdwr sectors (73938 MB) ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 14:47 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Журавлев ДенисДбашкабрр, там деревья блокировок получаются, просто не очевидно Код: plaintext 1. 2. 3. 4. 5.
т.е. надо посмотреть что делают 2460 и 2491 onstat -g ses 2460 onstat -g ses 2491 или прямо онменеджером Они каждый раз разные... Но поймал одну сессию. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45. 46. 47. 48. 49. 50.
... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 14:49 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
ДбашкабррЗа этой картиной я пристально смотрю... и вот что вижу... список уходит далеко в низ :) по моему там в левом комбоксе можно выбрать тип, чтобы показывались только эти 5 ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 14:51 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
В основном все ждут хранимку, которая пишет в CDR... ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 14:51 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Дбашкабрр Они каждый раз разные... Но поймал одну сессию. 4162 sqlexec 3a8886f0 L-BP--- 6912 sleeping(Forever) буква L, значит что она ждет блокировку, эта сессия нам неинтересна. Я бы сравнил структуру таблицы accounts, все блокировки на ней. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 14:54 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Журавлев ДенисДбашкабрр Они каждый раз разные... Но поймал одну сессию. 4162 sqlexec 3a8886f0 L-BP--- 6912 sleeping(Forever) буква L, значит что она ждет блокировку, эта сессия нам неинтересна. Я бы сравнил структуру таблицы accounts, все блокировки на ней. Код: plaintext 1. 2. 3. 4. 5. 6. 7. 8. 9. 10. 11. 12. 13. 14. 15. 16. 17. 18. 19. 20. 21. 22. 23. 24. 25. 26. 27. 28. 29. 30. 31. 32. 33. 34. 35. 36. 37. 38. 39. 40. 41. 42. 43. 44. 45.
... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 14:58 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
сессии быстро меняются... попробую чуть позже, когда нагрузка спадет, поймать что нибудь ценное... ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 14:59 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Дбашкабррсессии быстро меняются... попробую чуть позже, когда нагрузка спадет, поймать что нибудь ценное...режим журналирования у баз одинаковый? select name,is_logging,is_buff_log,is_ansi from sysmaster:sysdatabases; ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 15:24 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
Дбашкабрр На втором серваке 5-й рейд с 3 дисками. MegaRAID LD 0 RAID5 138G Version: 515H На первом просто винты SCSI device sda: 144410880 512-byte hdwr sectors (73938 MB) SCSI device sdb: 144410880 512-byte hdwr sectors (73938 MB) Вот вам и одна из причин. 5-й рейд - "смерть для БД". Фраза сильная, сказана много лет назад, с тех пор контролеры стали много быстрее, умнее и т.д. Я последний раз проверял ее справедливость лет 6-7 назад на свежем на тот момент оборудовании, для пользователей >10 она оказалась справедливой. 2 простых SCSI диска работют быстрее, чем 3 диска в 5-м рейде. ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 15:40 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
ктстати на первом размер журналов?? 16мб, на втором 4 мб. onstat -m со второго покажите ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 15:55 |
|
Мучают блокировки...
|
|||
---|---|---|---|
#18+
DaugavaВот вам и одна из причин. 5-й рейд - "смерть для БД". Фраза сильная, сказана много лет назад, с тех пор контролеры стали много быстрее, умнее и т.д. Я последний раз проверял ее справедливость лет 6-7 назад на свежем на тот момент оборудовании, для пользователей >10 она оказалась справедливой. 2 простых SCSI диска работют быстрее, чем 3 диска в 5-м рейде. Поддерживаю. Но требует проверки каким-то бенчмарком с использованием конкурентного доступа. И еще. Приведите для обоих серверов: onstat -d onstat -g iof onstat -p только за примерно одинаковый промежуток времени (1-2 часа стандартной работы пользователей). ... |
|||
:
Нравится:
Не нравится:
|
|||
26.05.2009, 15:56 |
|
|
start [/forum/topic.php?fid=44&msg=36007710&tid=1607681]: |
0ms |
get settings: |
9ms |
get forum list: |
16ms |
check forum access: |
4ms |
check topic access: |
4ms |
track hit: |
48ms |
get topic data: |
12ms |
get forum data: |
2ms |
get page messages: |
58ms |
get tp. blocked users: |
1ms |
others: | 326ms |
total: | 480ms |
0 / 0 |